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INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



International application No. 

PCT/FR00/01734 



1. Basis of the report 



1 . This report has been drawn on the basis of {Replacement sheets which have been furnished to the receiving Office in response to an invitation 
under Article J 4 are referred to in this report as "originally filed " and are not annexed to the report since they do not contain amendments ). 

the international application as originally filed. 
1^] the description, pages 1-8, 10-26 as originally filed, 

pages , filed with the demand, 

pages 9, 9bis t filed with the letter of 

pages , filed with the letter of 



20 July 2001 (20.07.2001) 



the claims. 



Nos. 
Nos. 
Nos. 
Nos. 
Nos. 



1-11 



, as originally filed, 

, as amended under Article 19, 

, filed with the demand, 

■t 

, filed with the letter of 

, filed with the letter of 



20 July 2001 (20.07.200 H 



the drawings, 



sheets/fig 
sheets/fig 
sheets/fig 
sheets/fig 



1/2, 2/2 



as originally filed, 
filed with the demand, 
filed with the letter of 
filed with the letter of 



2. The amendments have resulted in the cancellation of: 

1 1 the description, pages 

I I the claims, Nos. 



I 1 the drawings, sheets/fig 



^ I | This report has been established as if (some of) the amendments had not been made, since they have been considered 
1 — ' to go beyond the disclosure as filed, as indicated in the Supplemental Box (Rule 70.2(c)). 



4. Additional observations, if necessary: 
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INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



International application No. 
PCT/FR 00/01734 



V. Reasoned statement under Article 35(2) with regard to novelty, inventive step or industrial applicability; 
citations and explanations supporting such statement 



1 . Statement 

Novelty (N) 

Inventive step (IS) 
Industrial applicability (IA) 



Claims 
Claims 

Claims 
Claims 

Claims 
Claims 



1-11 



1-11 



1-11 



YES 
NO 
YES 
NO 

YES 
NO 



Citations and explanations 

1. Reference is made to the following documents: 

Dl: WO 99 17584 A (3COM CORP) 8 April 1999 (1999-04- 
08) 

D2: US-A-4 703 477 (ADELMANN HARRY W ET AL) 27 
October 1987 (1987-10-27) . 



2. Document Dl (see in particular page 4, line 3 to 

page 6, line 11; page 22, line 16 to page 28, line 
31; Figures 2 and 8), which is considered to be the 
prior art closest to the subject matter of Claim 1, 
describes a method for controlling the decoding and 
reproduction of a sound signal in an ATM system 
wherein buffer memory overflow is detected. 

2.1 Dl differs from the subject matter of Claim 1 in 

that a concatenation process is carried out on two 
consecutive frames when buffer memory overflow is 
detected . 



2.2 This feature compacts the two frames into a pseudo- 
frame no longer than one frame . 



Therefore, the problem that the present invention 
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INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



International application No. 
PCT/FR 00/01734 



aims to solve can be considered to be that of 
minimising data loss and a deterioration in quality 
when buffer memory overflow is detected. 



2.3 Document D2 does not mention compacting the two 
frames into a pseudo-frame that is shorter than, or 
the same length as, one frame. 

2.4 None of the cited documents, considered individually 
or in combination, ■ discloses reducing the size of a 
frame made of two frames when memory overflow 
occurs. Therefore, Claim 1 meets the requirements of 
novelty and inventive step of PCT Article 33(1) to 
(4) . 

2.5 Claims 2-10 depend on Claim 1 and, therefore, also 
meet, as such, the PCT requirements concerning 
novelty and inventive step. 



3. The same applies to Claim 11 which has the same 

combination of features as Claim 1, but is written 
as a device claim (see also Box VIII below) . 
Therefore, the subject matter of Claim 11 also meets 
the requirements of novelty and inventive step of 
PCT Article 33(1) and (4). 
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International application No. 
PCT/FR 00/01734 



INTERNATIONAL PRELIMINARY EXAMINATION REPORT 



VIII. Certain observations on the international application 



The following observations on the clarity of the claims, description, and drawings or on the question whether the claims are fully 
supported by the description, are made: 



although Claim 11 refers to other claims, it should 
be considered as an independent claim since it comes 
under a different category (device) . Therefore, 
Claim 11 should include the features essential for 
the definition of the claimed device, so as to 
clearly define the means required for implementing 
the method of one of Claims 1 to 10. 

Since independent Claim 11 does not contain these 
features, it fails to comply with the requirements 
of PCT Article 6 in combination with PCT Rule 
6.3(b), according to which an independent claim must 
contain all of the technical features essential for 
the definition of the invention. 

2 . Claim 1 is not clear and does not meet the 

requirements of PCT Article 6, to the extent that 
the subject matter for which protection is sought is 
not clearly defined. The vague and unclear wording 
used in the expression, "located at the input or 
output of the decoding unit" (page 27, tines 5-6) 
does not enable a person skilled in the art to 
determine the technical features necessary for 
producing the claimed apparatus since, according to 
the description, it is clear that there are always 
two buffer memories, one at the input and one at the 
output of the decoding unit. Therefore, this 
expression should have been written as "located at 
the input and output". 



1 . 



As already observed in the first written opinion, 
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TRAITE DE COOPERATION EN MATIERE DT'BREVETS 

Expediteur: le BUREAU INTERNATIONAL 



WO 01/01727 
PCT/FR00/01734 



PCT 

AVIS INFORMANT LE DEPOSANT DE LA 
COMMUNICATION DE LA DEMANDE 
INTERNATIONALE AUX OFFICES DESIGNES 

(regie 47.1. c), premiere phrase, du PCT) 



Oestinataire: 

MARTIN, Jean-Jacques 
Cabinet Regimbeau 
26, Avenue Kleber 
F-75116 
FRA 



Date d'expedition (jour/mois/annee) 
04janvier 2001 (04.01.01) 






Reference du dossier du deposant ou du mandataire 
341015/18113 


AVIS IMPORTANT 


Demande Internationale no 
PCT/FR00/01734 


Date du depot international (jour/mois/annee) 
22 juin 2000(22.06.00) 


Date de priorite (jour/mois/annee) 
24 juin 1999 (24.06.99) 


Deposant 

FRANCE TELECOM etc 



1. II est notifie par la presente qu'a la date indiquee ci-dessus comme date d'expedition de cet avis, !e Bureau international a 
communique, comme le prevoit I'article 20, la demande Internationale aux offices designes suivants: 

US 



Conformement a la regie 47.1.c), troisieme phrase, ces offices acceptent le present avis comme preuve determinants 
du fait que la communication de la demande internationale a bien eu lieu a la date d'expedition indiquee plus haut, et le 
deposant n'est pas tenu de remettre de copie de la demande internationale a i'office ou aux offices designes. 

2. Les offices designes suivants ont renonce a I'exigence selon laquelle cette communication doit etre effectuee a cette date: 
EP,IL 



La communication sera effectuee seulement sur demande de ces offices. De plus, le deposant n'est pas tenu de remettre 
de copie de la demande internationale aux offices en question (regie 49.1)a-bis)). 

3. Le present avis est accompagne d'une copie de la demande internationale publiee par le Bureau international le 
04 janvier 2001 (04.01.01) sous le numero WO 01/01727 



RAPPEL CONCERNANT LE CHAPITRE II (article 31.2)a) et regie 54.2) 

Si le deposant souhaite reporter I'ouverture de la phase nationale jusqu'a 30 mois (ou plus pour ce qui concerne certains 
offices) a compter de la date de priorite, la demande d'examen preliminaire international doit etre presentee a 
I'administration competente chargee de I'examen preliminaire international avant I'expiration d'un delai de 19 mois a 
compter de la date de priorite. 

II appartient exclusivement au deposant de veiller au respect du delai de 19 mois. 

II est a noter que seul un deposant qui est ressortissant d'un Etat contractant du PCT lie par le chapitre II ou qui y a son 
domicile peut presenter une demande d'examen preliminaire international. 

RAPPEL CONCERNANT LOUVERTURE DE LA PHASE NATIONALE (article 22 ou 39.1)) 

Si le deposant souhaite que la demande internationale procede en phase nationale, il doit, dans le delai de 20 mois ou 
de 30 mois, ou plus pour ce qui concerne certains offices, accomplir les actes mentionnes dans ces dispositions aupres 
de chaque office designe ou elu. 

Pour d'autres informations importantes concernant les delais et les actes a accomplir pour I'ouverture de la phase 
nationale, voir I'annexe du formulaire PCT/IB/301 (Notification de la reception de I'exemplaire original) et le volume II 
du Guide du deposant du PCT. 



Bureau international de I'OMPI 


Fonctionnaire autorise 


| 34, chemin des Colombettes 


J. Zahra 


1211 Geneve 20. Suisse 


no de telecopieur (41-22) 740.14.35 


no de telephone (41-22) 338.83.38 



Formulaire PCT/IB/308 (juillet 1 996) 3744285 
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WO 01/01727 
PCT/FROO/01734 

Suite du formulaire PCT/IB/308 



AVIS INFORMANT LE DEPOSANT DE LA COMMUNICATION DE 
LA DEMANDE INTERNATIONALE AUX OFFICES DESIGNES 



Date d'expedition (jour/mois/annee) 
04janvier 2001 (04.01.01) 


AVIS IMPORTANT 


Reference du dossier du deposant ou du mandataire 
341015/18113 


Demande internationale no 
PCT/FROO/01734 



II est notifie au deposant que, au moment de Tetablissement du present avis, le delai fixe a la regie 46.1 pour le depot de 
modifications selon Tarticle 19 n'etait pas encore expire et que le Bureau international n'avatt pas regu de modications ni de 
declaration Tinformant que le deposant ne souhaitait pas presenter de modifications. 



Formulaire PCT/IB/308 (feuille annexe) (juillet 1996) 



3744285 
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TRAITE DE COOPERATION EN MATIERE DE BREVETS 

Expediteur: le BUREAU INTERNATIONAL 



PCT 



NOTIFICATION DE LA RECEPTION DE 
L'EXEMPLAIRE ORIGINAL 

{regie 24.2.a) du PCT) 



Destinataire: 



MARTIN, Jean-Jacqi 
Cabinet Regimbeau 
26, Avenue Kleber 
F-75116 Paris 
FRANCE 



tes 



A R R i V L 



0 <. 



Date d'expedition (jour/mo is/an nee) 

30 aout 2000 (30.08.00) 


NOTIFICATION IMPORTANTE 


Reference du dossier du deposant ou du mandataire 
341015/18113 


Demande inter nationale no 
PCT/FR00/01734 



li est notifie au deposant que le Bureau international a regu I'exemplaire original de la demande internationale precisee 
ci-apres. 

Nom(s) du ou des deposants et de I'Etat ou des Etats pour lesquels ils sont deposants: 

FRANCE TELECOM (pour tous les Etats designes sauf US) 

DELEAM, David etc. (pour US seulement) 

Date du depot international 22 juin 2000 (22.06.00) 

Date(s) de priorite revendiquee(s) 24 juin 1999 (24.06.99) 

Date de reception de I'exemplaire original " A 

par le Bureau international : 02 aout 2000 (02.08.00) 

Liste des offices designes : 

EP :AT,BE,CH,CY,DE,DK,ES,FI,FR,GB,GR,IE,IT,LU,MC,NL,PT,SE 
National :IL,US 



ATTENTION 

Le deposant doit soigneusement verifier les indications figurant dans la presente notification. En cas de divergence entre ces 
indications et celles que contient la demande internationale, il doit aviser immediatement le Bureau international. 

En outre, I'attention du deposant est appelee sur les renseignements donnes dans I'annexe en ce qui concerne 



les delais dans lesquels doit etre abordee la phase nationale 
X | la confirmation des designations faites par mesure de precaution 
j J les exigences relatives aux documents de priorite. 



Une copie de la presente notification est envoyee a I'office recepteur et a I'administration chargee de la recherche internationale. 



Bureau international de rOMPI 
34, chemin des Colombettes 
1211 Geneve 20, Suisse 



n'detelecopeur (41-22) 740.14.35 



Fonctionnaire autorise 



Simin Baharlou 
n'de telephone (41-22) 338.83.38 



Formulaire PCT/IB/301 Quillet 1998) 



003495606 
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ANNEXE DU FORMULAIRE PCT/IB/301 



ide Internationale no 
PCT/FROO/01734 



RENSEIGNEMENTS CONCERNANT LES DELAIS DANS LESQUELS DOIT ETRE ABORDEE 

LA PHASE NATIONALE 



II est rappele au deposant qu'il doit aborder ia "phase nationale" aupres de chacun des offices designes indiques sur la 
notification de la reception de I'exemplaire original (formulaire PCT/IB/301) en payant les taxes nationales et en remettant les 
traductions, telles qu'elles sont prescrites par les legislations nationales. 

Le delai d'accomplissement de ces actes de procedure est de 20 MOIS a compter dela date de priorite ou, pour les Etats 
designes qui ont ete elus par le deposant dans une demande d'examen preliminaire international ou dans une election ulterieure, 
de 30 MOIS a compter de la date de priorite, a condition que cette election ait ete effectuee avant I'expiration du 19e mois a 
compter de la date de priorite. Certains offices designes (ou elus) ont fixe des delais qui expirent au-deta de 20 ou 30 mois a 
compter de la date de priorite. D'autres offices accordent une prolongation des delais ou un delai de grace, dans certains cas 
moyennant le paiement d'une taxe supplemental. 

En plus de ces actes de procedure, le deposant devra dans certains cas satisfaire a d'autres exigences particulieres 
applicables dans certains offices. II appartient au deposant de veiller a remplir en temps voulu les conditions requises pour 
I'ouverture de la phase nationale. La majorite des offices designes n'envoient pas de rappel a I'approche de la date limite pour 
aborder la phase nationale. 

Des informations detail lees concernant les actes de procedure a accomplir pour aborder la phase nationale aupres de 
chaque office design e, les delais applicables et la possibility d'obtenir une prolongation des delais ou un delai de grace et toutes 
autres conditions applicables figurent dans le volume II du Guide du deposant du PCT. Les exigences concernant le depot d'une 
demande d'examen preliminaire international sont exposees dans le chapitre IX du volume I du Guide du deposant du PCT. 

GR et ES sont devenues liees par le chapitre II du PCT le 7 septembre 1996 et le 6 septembre1997, respectivement, et 
peuvent done etre elues dans une demande d'examen preliminaire international ou dans une election ulterieure presentee le 7 
septembre 1996 (ou a une date posterieure) ou le 6 septembre 1997 (ou a une date posterieure), respectivement, quelle que soit 
la date de depot de la demande internationale (voir le second paragraphs ci-dessus). 

Veuillez noter que seul un deposant qui est ressortissant d'un Etat contractant du PCT lie par le chapitre II ou qui y a 
son domicile peut presenter une demande d'examen preliminaire international. 



CONFIRMATION DES DESIGNATIONS FAITES PAR MESURE DE PRECAUTION 



Seules les designations expresses faites dans la requete conformement a la regie 4.9.a) figurent dans la presente 
notification. II est important de verifier si ces designations ont ete faites correctement. Des erreurs dans les designations peuvent 
etre corrigees lorsque des designations ont ete faites par mesure de precaution en vertu de la regie 4.9.b). Toute designation 
ainsi faite peut etre confirmee conformement aux dispositions de la regie 4.9.c) avant I'expiration d'un delai de 15 mois a 
compter de la date de priorite. En I'absence de confirmation, une designation faite par mesure de precaution sera consideree 
comme retiree par le deposant. II ne sera adresse aucun rappel ni invitation. Pour confirmer une designation , il faut deposer une 
declaration precisant I'Etat designe concerne (avec I'indication de la forme de protection ou de traitement souhaitee) et payer les 
taxes de designation et de confirmation. La confirmation doit parvenir a I'office recepteur dans le delai de 15 mois. 



EXIGENCES RELATIVES AUX DOCUMENTS DE PRIORITE 

Pour les deposants qui n'ont pas encore satisfait aux exigences relatives aux documents de priorite, il est rappele ce qui 

suit. 

Lorsque la priorite d'une demande nationale, regionale ou internationale anterieure est revendiquee, le deposant doit 
presenter une copie de cette demande anterieure, certifiee conforme par ('administration aupres de laquelte elle a ete deposee 
("document de priorite"), a I'office recepteur (qui la transmettra au Bureau international) ou directement au Bureau international, 
avant I'expiration d'un delai de 16 mois a compter de la date de priorite, etant entendu que tout document de priorite peut etre 
presente au Bureau international avant la date de publication de la demande internationale, auquel cas ce document sera repute 
avoir ete recu par le Bureau international le dernier jour du delai de 16 mois (regie 17.1. a)). 

Lorsque le document de priorite est delivre par I'office recepteur, le deposant peut, au lieu de presenter ce document, 
demander a I'office recepteur de le preparer et de le transmettre au Bureau international. La requete a cet effet doit etre 
formulee avant I'expiration du delai de 16 mois et peut etre soumise au paiement d'une taxe (regie 17.1.b)). 

Si le document de priorite en question n'est pas fourni au Bureau international, ou si la demande adressee a I'office recepteur 
de preparer et de transmettre le document de priorite n'a pas ete faite (et la taxe correspondante acquittee, le cas echeant) 
avant I'expiration du delai applicable mentionne aux paragraphes precedents, tout Etat designe peut ne pas tenir compte 
de la revendication de priorite; toutefois, aucun office designe ne peut decider de ne pas tenir compte de la revendication de 
priorite avant d'avoir donne au deposant la possibility de remettre le document de priorite dans un delai raisonnable en I'espece. 

Lorsque plusieurs priorites sont revendiquees, la date de priorite a prendre en consideration aux fins du calcul du delai de 
16 mois est la date du depot de la demande la plus ancienne dont la priorite est revendiquee. 
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TRAITE DE COOPERATION EN MATIERE DE BREVETS 



ExpSditeur : le BUREAU INTERNATIONAL 



PCT 


Destinataire: 


NOTIFICATION RELATIVE 
A LA PRESENTATION OU A LA TRANSMISSION 
DU DOCUMENT DE PRIORITE 

(instruction administrative 41 1 du PCT) 


IVI/Aii t Jean -Ja^ijuco 

Cabinet Regimbeau 
26, Avenue Kleber 
F-75lib Paris 
FRANCE 


Date d'expedition (jour/mois/annee) 
30 aoOt 2000 (30.08.00) 






Reference du dossier du deposant ou du mandataire 
341015/18113 


NOTIFICATION IMPORTANTE 


Dsmsnd© intcrnstionsl© no * v *- -j 
PCT/FR00/01734 


Date du depot .international (jour/mois/annee) 
: 22 juin 2000 (22.06.00) 


Date de publication international (jour/mois/annee) 

Pas encore publiee 


Date de priorite (jour/mois/annee) 
24 juin 1999 (24.06.99) 


Deposant 




FRANCE TELECOM etc 




1. La date de reception (sauf lorsque les lettres "NR" figurent dans la colonne de droite) par le Bureau international du ou des 
documents de priorite correspondant a la ou aux demandes enumerees ci-apres est notifiee au deposant. Sauf indication 
contraire consistant en un asterisque figurant a cote d'une date de reception, ou les lettres "NR", dans la colonne de droite, 
le document de priorite en question a ete presente ou transmis au Bureau international d'une maniere conforme a la 
regie 17.1. a) ou b). 

2. Ce formulaire met a jour et remplace toute notification relative a la presentation ou a la transmission du document de priorite 
qui a ete envoyee precedemment. 

3. Un asterisque!*) figurant a cote d'une date de reception dans la colonne de droite signale un document de priorite presente 
ou transmis au Bureau international mais de maniere non conforme a la regie 17.1. a) ou b). Dans ce cas, I'attention du 
deposant est appelee sur la regie 17.1.c) qui stipule qu'aucun office designe ne peut decider de ne pas tenir compte de \a 
revendication de priorite avant d'avoir donne au deposant la possibility de remettre le document de priorite dans un delai 
raisonnable en I'espece. 

4. Les lettres "NR" figurant dans la cotonne de droite signalent un document de priorite que le Bureau international n*a pas 
recu ou que le deposant n'a pas demande a I'office recepteur de preparer et de transmettre au Bureau international, 
conformement a la regie 17.1.a) ou b), respectivement. Dans ce cas, 1' attention du deposant est appelee sur la regie 17.1.c) 
qui stipule qu'aucun office designe ne peut decider de ne pas tenir compte de la revendication de priorite avant d'avoir donne 
au deposant la possibilite de remettre le document de priorite dans un delai raisonnable en I'espece. 


Date de Driorite Demande de Driorite n* Pavs, office reaional ou Date de reception du 

office receDteur selon le PCT document de priorite 


24 juin 1999 (24.06.99) 99/08081 


FR 02 aout 2000 (02.08.00) 


Bureau international de TOMPt 
34. chemtn des Colombettes 
121 1 Geneve 20, Suisse 

no de telecopieur (41-22) 740.14.35 


Fonctionnaire autorise:<^- v . ^ZX^ ^ 
Simin Baharlou 

no de telephone (41-22) 338.83.38 


Formulaire PCT/IB/304 (juillet 1998) 


003495607 
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PCT 

REQUETE 



Le soussigne requiert que la presente demande 
internationale soit traitee conformement au Traite de 
cooperation en matiere de brevets. 



Reserve a Poffice recepteur 



Demande internationale n° 



Date du depot international 



Nom de Poffice recepteur et "Demande internationale PCT" 



Reference du dossier du deposant ou du mandataire (facultatif) 
(} 2 carac teres au maximum) 34 101 5/ 18113 



Cadre n° I TITRE DE L'INVENTIONPROCEDE POUR 

RESTITUTION D r UN SIGNAL S0N0RE DANS UN 


LA GESTION DU DECODAGE ET DE LA 
SYSTEME DE TRANSMISSION ASYNCHRONE 


Cadre n° II DEPOSANT 


Nom et adresse : (Nom defamille suivi du prenom; pour une personne morale, designation 
officielle complete. L 'adresse doit comprendre le code postal et le nom du pays. Lepays de 
{adresse indiquee dans ce cadre est I Etat oil le deposant a son domicile si aucun domicile 
n 'est indique ci-dessous.) 

FRANCE TELECOM 
6 Place d'Alleray 
75015 PARIS 
FRANCE 


I I Cette personne est aussi 
* ' inventeur. 


n' de telephone 


n° de telecopieur 


n° de teleimprimeur 


jbja^tionalite (nom de I'Etat) : 


Domicile (nom de PEtat) : 
FR 


Cette personne est I 1 tous les Etats fTTl tous.Ies Etats designes sauf J | les Etats-Ums d'Amerique I 1 les Etats mdiques dans 

deposant pour : |_J designes \*J les Etats-Unis d'Amerique | | seulement | I le cadre supplemental 


Cadre n° III AUTRE(S) DEPOSANT(S) OU (AUTRE(S)) INVENTEUR(S) 


Nom et adresse : (Nom de famille suivi du prenom; pour une personne morale, designation 
officielle complete. L adresse doit comprendre le code postal et le nom du pays. Le bays de 
ladresse indiquee dans ce cadre est I Etat ou le deposant a son domicile si aucun domicile 
n 'est indique ci-dessous.) 

DELEAM David 

1 1 Rue du Marechal Leclerc 

22700 PERROS GUIREC 

FRANCE 


Cette personne est : 

j~ | deposant seulement 

\)( | deposant et inventeur 

| | inventeur seulement 
(Si cette case est cochee, 
ne pas remplir la suite.) 


Nationality (nom de I'Etat) : 
FR 


Domicile (nom de PEtat) : 
FR 


Cette Dersonne est I 1 tous les Etats 1 1 tousles Etats designes sauf r^l les Etats-Unis d'Amerique I | les Etats md.ques dans 

dlposant pour □ dTsignes |_J les Etats-Unis d'Amerique jXJ seulement 1 1 ^adre supplementa.re 


|y | D'autres deposants ou inventeurs sont indiques sur une feuille annexe. 


Cadre n" IV MANDATAIRE OU REPRESENTANT COMMUN; OU ADRESSE POUR LA CORRESPONDANCE 


La personne dontl'identite est donnee ci-dessous est/aete designee pour agirau nom duou i i man dataire | 1 representant commun 
des deposants aupres des autorites internationales competentes, comme: L^J 1 1 


Nom et adresse : (Nom de famille suivi du prenom; pour une personne morale, designation officielle 
complete. L adresse doit comprendre le code postal et le nom du pays.) 

MARTIN Jean-Jacques, SCHRIMPF Robert, AHNER Francis, 

WARCOIN Jacques, TEXIER Christian, LE FORESTIER Eric 

CABINET REGIMBEAU 

26 Avenue Kleber 

751 16 PARIS 

FRANCE 


n° de telephone 

01 45 00 92 02 


n* de telecopieur 

01 45 00 46 12 


iV de teleimprimeur 


I 1 Adresse pour la correspondance : cocher cette case lorsque aucun mandataire ni representant commun n'est/n*a ete designe 

I | et que Pcspace ci-dessus est utilise pour indiquer une adresse speciale a laquelle la correspondance doit etre envoyee. 



Formulaire PCT/RO/1 01 (premiere feuille) (juillet 1 998; reimpression janvier 2000) Voir les notes relatives auformulaire de requite 
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Feuille n° 



Suite du cadre n° III AUTRE(S) DEPOSANT(S) OU (AUTRE(S)) INVENTEUR(S) 


Si aucun des sous-cadres suivants n'est utilise, cette feuille ne doit pas etre incluse dans la requite. 


Nom et adrcsse : (Norn de famille suivi du prenom; pour une personne morale, designation 
officielle complete. L adresse doit comprendre le code postal et le nom du pays. Le pays de 
ladresse indiquee dans ce cadre est I Etat ou le deposant a son domicile si aucun domicile 
n 'est indique ci-dessous.) 

KOVESI Balazs 
12 Residence Corlay 
22300 LANNION 
FRANCE 


Cette personne est : 
L_U d ^P osant seulement 
|y | deposant et inventeur 

| | inventeur seulement 
(Si cette case est cochee, 
ne pas remplir la suite.) 


Nationality (nom de PEtat) : 

HU r 


Domicile (nom de PEtat) : 
FR 


Cette personne est ( | tous les Etats 1 1 tous les Etats designes sauf " 1 %> | les Etats-Unis d'Amerique 1 | les Etats indiques dans 
deposant pour : 1 1 designes 1 1 les Etats-Unis d'Amerique 1AJ seulement 1 ■ le cadre supplemental 


Nom et adresse : (Nom de famille suivi du prenom; pour une personne morale, designation 
officielle complete. L 'adresse doit comprendre le code postal et le nom du pays. Le pays de 
ladresse indiquee dans ce cadre est I 'Etat oil le deposant a son domicile si aucun domicile 
n 'est indique ci-dessous.) 

PETIT Jean-Pierre 
10 Cite Zant Erwan 
22220 MINIHY TREGUIER 
FRANCE 


Cette personne est : 

| J deposant seulement 

\)C\ deposant et inventeur 

| | inventeur seulement 

(Si cette case est cochee, 
ne pas remplir la suite.) 


Nationality (nom de PEtat) : 
FR 


Domicile (nom de PEtat) : 
FR 


Cette personne est I 1 tous les Etats 1 1 tous les Etats designes sauf ["vl les Etats-Unis d'Amerique 1 I les Etats indiques dans 

deposant pour : I I designes | | les Etats-Unis d'Amerique |_AJ seulement | J le cadre supplemental 


Nom et adresse : (Nom de famille suivi du prenom; pour une personne morale, designation 
officielle complete. L 'adresse doit comprendre le code postal et le nom du pays. Le pays de 
ladresse indiquee dans ce cadre est l'Etat ou le deposant a son domicile si aucun domicile 
n 'est indique ci-dessous.) 


Cette personne est : 

j | deposant seulement 

j ~[ deposant et inventeur 

| | inventeur seulement 
(Si cette case est cochee, 
ne pas remplir la suite.) 


Nationality (nom de l'Etat) : 


Domicile (nom de PEtat) : 


Cette personne est I 1 tous les Etats * 1 tous les Etats designes sauf J I les Etats-Unis d'Amerique | 1 les Etats indiques dans 

deposant pour 1 1 designes | | les Etats-Unis d'Amerique | | seulement | | le cadre supplemental 


Nom et adresse : (Nom de famille suivi du prenom; pour une personne morale, designation 
officielle complete. L adresse doit comprendre le code postal et le nom du pays. Lepays de 
ladresse indiquee dans ce cadre est I 'Etat ou le deposant a son domicile st aucun domicile 
n 'est indique ci-dessous.) 


Cette personne est : 

[ j deposant seulement 

| | deposant et inventeur 

^~~^| inventeur seulement 

(Si cette case est cochee, 
ne pas remplir la suite.) 


Nationality (nom de PEtat) : 


Domicile (nom de PEtat) : 


Cette personne est I 1 tous les Etats ( | tous les Etals designes sauf 1 | les Etats-Unis d'Amerique 1 | les Etats indiques dans 

deposant pour : 1 1 designes | I les Etats-Unis d'Amerique | | seulement | | le cadre supplemental 


| | D'autres deposants ou inventeurs sont indiques sur une autre feuille annexe. 



Formulaire PCT/RO/101 (feuille annexe) (juillet 1998; reimpression janvier 2000) Voir les notes relatives au formula ire de requite 
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Fcuillc n' 



o 3 



Cadre 11* V DESIGNATION DIKTATS 



Los designations suivantes sont f'aitcs confornicmcnl a la regie 4.9.a) (cocker les cases appropriees; une an moms doit I etre) 
Brevet regional 

□ AP 

□ EA 



Brevet ARIPO • GH Ghana. CM Gamble. KE Kcnva. LS Lesotho. MW Malawi, SD Soudan, SL Sierra Leone, 
SZ Swaziland, TZ Rcpubliquc-Unic do Tanzanic, UG Ouganda, ZW Zimbabwe el lout autre Elal qui est un Elal contract ant du 



H EP 



Protocols de Harare ct du PCT 

Brevet curasien: AM Anncnie. AZ Azcrbai'djan. BY Belarus. KGKirghizistan. KZ Kazakhstan, MD Rcpublique dc Moldova. 
RU Federation de Russie. TJ Tadjikistan. TM Turkmenistan et lout autre £lat qui est un Bat conlractanl de la Convention sur 
Ic brevet curasicn et du PCT 
Brc 
DK 
LU 

Convention sur le brevet curopcen ct du PC 1 
□ OA Brevet OAPI : BF Burkina Faso, BJ Benin, CF Rcpublique ecntrai'ricaine.. CG Congo, CI Cote dTvoirc, 
CMCamcroun. GA Gabon. GN Guincc. CW Guincc-Bissau. ML Mali, MR Mauritanic.. NE Niger, SN Senegal. 
TD Tchad. TG Toco el tout autre Elal qui est un £tat mcinbrc de POAPi ct un Etat contraeiant du PCT (si une attire forme 



)rcvel curasicn et du 1'LJ 

cvet curopcen : AT Autriche, BE BeUiquc, CH ct LI Suisse et Liechtenstein, CY Chypre, DE Allcmagnc, 
C Dancmark, ES Espaane, FI Einlande, FR France. CB Royaumc-Uni, GR Greec, IE LI and c, IT Italic, 
I Luxembourg. MC Monaco, NLPays-Bas. PT Portugal, SE Suede ct lout autre Etat qui est un Ltat eontraetant dc la 



de protection on de rraitement estsouhaitee. le preciser sur la ligne poimillee) 

Brevet national (si une autre forme de protection on de incitement estsouhaitee, le preciser sur la ligne pomfillee) 



D AE Emirats arabes unis 
□ AL Albanic 



Autrichc □ LU 

□ LV 



Austral ic 
Azcrbai'djan 



Liberia 
Lesotho , 
Lituanic 
Luxembourg 
Lcttonic 



n MA Ma roc 



-Herzceovinc MD Rcpublique dc Moldova 



FI MG Madagascar 



Bosnic 
Barbadc 

Bulgarie C M ^ Ex-Republiquc yougoslave dc Maeedoinc 

Brcsil 

Belarus D 

Canada D 



MN Mongolie 
MW Malawi . . 
MX Mcxiquc 



□ LR 

□ LS 

□ AM Armcnie ED LT 

□ AT 

□ AU 

□ AZ 

□ BA 

□ BB 

□ BG 

□ BR 

□ BY 

□ CA 

□ CH ct LI Suisse ct Liechtenstein 

□ CN Chine □ NO Norvcge 

□ CR Costa Rica 

□ CU Cuba □ PL 

□ CZ Rcpublique t cheque □ PT 

□ DE Allcmagnc □ 

□ DK Dancmark . . 
Q DM Dominique 

□ EE Estonie .... 

□ ES Espagnc . . . 

□ FI Finlande . . . 

□ GB Royaumc-Uni 

□ GD Grenade 

□ GE Georgie □ TJ 

□ GH Ghana □ ™ Tuikmcnirtan 

□ CM (iambic □ TR Turc * uic ■ 



□ RU 

□ SD 

□ SE 

□ SG 

□ SI 

□ SK 

□ SL 



NZ Nouvcllc-Zclandc . . . 

Polognc 

Portugal 

Roumanic 

Federation de Russie 
Soudan 
Suede 
Singapour 

Slovcnic 

Slovaquic 

Sierra Leone 

Tadjikistan 



□ HR Croatic 



Trinitc-el-Tobago 



□ HU 

□ ID 
0 1L 

□ IN 

□ IS 

□ JP 



Hon<ric □ TZ Rcpubliquc-Unic de Tanzanic 



□ UA Ukraine 

□ UG Ouganda 



E US Etats-Unis d'Amcrique 



Ouzbekistan 
Vict Nam . 



Indoncsic 

Israel 

Inde 

Islandc 

Japon □ UZ 

□ KE Kenya □ VN 

□ KG Kirghizistan □ YU Yougoslavic 

□ KP Rcpublique populairc democrat ique de Corcc . □ ZA Alii que du Sud 

□ ZW Zimbabwe 

□ KR Rcpublique de Corcc Cases reservces pour la designation d'Etals qui sont devenus parties 

□ KZ Kazakhstan au a P r<is ^ a publication dc la prcsenlc fcuillc : 

□ LC Saintc-Lucic □ .PZ Algerie □ MZ Mozambique 

□ LK Sri Lanka □ AG et Barbuda . QBZ Belize 

Declaration concci nant les designations <le precaution : outre les designations laites ci-dessus. Ic deposant fail aussi conlormement 
a la regie 4. <).h) Unites les designations qui seraicnl autorisees cn veilu du PCT. a V exception dc Unite designation indiqucc dans le cadre 
supplcmcntaire commc cianl exclue dc la portcc de cette declaration. Le deposani declare que ccs designations additionnclles sont 
faitcs sous reserve dc confirmation ct que loulc designation qui n* est pas confirmee avant V expiration d un dclai dc 1 5 moisa compter 
dc la dale dc prior ile doitctrc considercc commc retiree par le deposant a I* expiration dc ce dclai. (La con firmation fycompris les taxes) 
doit parvenir a I office recepleur dans le delai de 1 5 mots. ) ^ 



Formulairc PCT/ROTOI (deuxicme fcuillc) (janvicr 2000) 



I 'oir les notes relatives an formulairc de reqnete 
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Feuille n° 



Cadre n° VI REVINDICATION DE PRIORITE 



□ 



D'autres rcvcndications de priorite sont 
indiquees dans le cadre supplementaire. 



Date de depot 
de la demande anterieure 
(jour/m o is/an nee) 



Numero 
de la demande anterieure 



Lorsque la demande anterieure est une : 



demande nationale : 
pays 



demande regionale :* 
office regional 



demande internationale : 
office recepteur 



(1) 



24/06/99 



99 08081 



FRANCE 



(2) 



(3) 



fx~| L' office recepteur est prie de preparer et de transmettre au Bureau international une copie certifiee conforme de la ou des demandes 
— anterieures (settlement si la demande anterieure a ete deposee aupres de l' office qui, auxfins de ^ 



la presente demande internationale, est I 'office recepteur) indiquees ci-dessus au(x) point(s) : 



* Si la demande anterieure est une demande ARJPO. il est obligatoire d'indiquer dans le cadre supplementaire au moins un pays partie a la Convention 
de Paris pour la protection de la propriete industrielle pour lequel cette demande anterieure a ete deposee (regie 4.10.b)ii)). Voir le cadre supplementaire. 



Cadre n° VII ADMINISTRATION CHARGEE DE LA RECHERCHE INTERNATIONALE 



Choix de l'administration chargee de la recherche 
internationale (ISA) (si plusieurs administrations 
chargees de la recherche internationale sont competentes 
pour proceder a la recherche internationale, indiquer 
I' administration choisie; le code a deux lettres peut etre 
utilise) : 

ISA/ EP 



Demande d'utilisation desresultats d'une recherche anterieure; mention de 
cette recherche (si une recherche anterieure a ete effectuee par V administration 
chargee de la recherche internationale ou demandee a cette demiere) : 

Date (jour/mois/annee) Numero Pays (ou office regional) 



15 FEVRIER 2000 



FA 576689 



OEB 



Cadre n° VIII BORDEREAU; LANGUE DE DEPOT 



La presente demande internationale contient 
le nombre de feuilles suivant : 



requete 

description (sauf partie reservee 
au listage des sequences) 

revendications 

abrege 

dessins 

partie de la description reservee 
au listage des sequences : 

Nombre total de feuilles 



26 
2 
1 
2 



35 



Le ou les elements coches ci-apres sont joints a la presente demande internationale : 

1 . O feuille de calcul des taxes 

2 □ pouvoir distinct signe a Sllivre (2) 



f*~l copie du pouvoir general; numero de reference, le cas echeant : 
n explication de l'absence d'une signature 

(3 document(s) de priorite indique(s) dans le cadre n° VI au(x) point(s) : 
f"~l traduction de la demande internationale en (langue) : 



3 
4 
5 
6 

7. □ indications separees concernant des micro-organismes ou autre materiel 

biologique deposes 

8. □ listage des sequences de nucleotides ou d'acides amines sous forme 

dechifTrable par ordinateur 

9. H autres elements (preciser) : Copie du Rapport de Recherche 



Figure des dessins qui 3 
doit accompagner Pabrege : 


Langue de depot de la 

demande internationale : FrancpaiS 


Cadre n° IX SIGNATURE DU DEPOSANT OU DU MANDATAIRE 



A cote de chaque signature, indiquer le nom du signataire et, si cela n 'apparait pas clairerne'nt a tdTecture-d&la requ^ 

CABffSIT REGfMSEAU 
26. Avenu® Ki6Der 

TEXIER Christian ' , ™™ ^ FRANCS 




/ 'inter esse signe. 



\. Date effective de reception des pieces supposees 
constituer la demande internationale : 


2. Dessins : 
|" | recus : 

| | non recus : 


3. Date effective de reception, rectifiee en raison de la reception ulte- 
rieure, mais dans les delais, de documents ou de dessins completant ce 
qui est suppose constituer la demande internationale : 


4. Date de reception, dans les delais, des corrections 
demandees selon Tarticle 1 1 .2) du PCT : 


5. Administration chargee de la recherche - . 
internationale (si plusieurs sont competentes) : loA / 


6. 1 1 Transmission de la copie de recherche differee 
1 | jusqu'au paiement de la taxe de recherche. 



Date de reception de Texemplaire 
original par le Bureau international : 



Reserve au Bureau international 



Formulaire PCT/RO/101 (derniere feuille) (juillet 1998; reimpression janvier 2000) 



Voir les notes relatives au formulaire de requete 
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JRAITE 



OOPERATION EN MATIERE B&BREVETS 




Expediteur: L'ADMINISTRATION CHARGEE DE 

UEXAMEN PRELIMINAIRE INTERNATIONAL 



Destinataire: 

MARTIN, Jean-Jacques 
Cabinet Regimbeau 
20, rue de Chazelles 
F-75847 Paris Cedex 17 
FRANCE 



ARRIVE. L 



- 1 OCT, 7 



tetre • 



Reference du dossier du deposant ou du mand dtai r cr 
341015/18113 



PCT 



NOTIFICATION DE TRANSMISSION DU 
_ -RAPPORT D'EXAMEN PRELIMINAIRE 
INTERNATIONAL 



Date d 



_ Ifour/mois 'ann$e) 



(regie 71.1 du PCT) 



3X| >edition 



28.09.2001 



NOTIFICATION IMPORTANTE 



Demande intemationale No. 
PCT/FR00/01734 



Date du depot international (jour/mois/annee) 
22/06/2000 



Date de priorite (jour/mois/ann6e) 
24/06/1999 



Deposant 

FRANCE TELECOM et al. 



II est notifie au deposant que radministration chargee de I'examen preliminaire international a etabli le rapport 
d'examen preliminaire international pour la demande intemationale et le lui transmet ci-joint, accompagne, le 
cas echeant, de ces annexes. 



2. Une copie du present rapport et, le cas echeant, de ses annexes est transmise au Bureau international pour 
communication a tous les offices elus. 



3. Si tel ou tel office elu I'exige, le Bureau international etablira une traduction en langue anglaise du rapport (a 
r exclusion des annexes de celui-ci) et la transmettra aux offices interesses. 



4. RAPPEL 

Pour aborder la phase nationale aupres de chaque office elu, le deposant doit accomplir certains actes (depot 
de traduction et paiement des taxes nationales) dans le delai de 30 mois a compter de la date de priorite (ou 
plus tard pour ce qui concerne certains offices) (article 39.1) (voir aussi le rappel envoye par le Bureau 
international dans le formulaire PCT/IB/301). 



Losrqu'une traduction de la demande intemationale doit etre remise a un office elu, elle doit comporter la 
traduction de toute annexe du rapport d'examen preliminaire international. II appartient au deposant d'etablir la 
traduction en question et de la remettre directement a chaque office elu interesse. 

Pour plus de precisions en ce qui concerne les delais applicables et les exigences des offices elus, voir le 
Volume II du Guide du deposant du PCT. 



Nom et adresse postale de I'adminstration chargee de I'examen 
preliminaire international 

Office europeen des brevets 
D-80298 Munich 

Tel. +49 89 2399 - 0 Tx: 523656 epmu d 
Fax: +49 89 2399 - 4465 



Fonctionnaire autorise 
Finnie, A 

T6I.+49 89 2399-8251 




Formulaire PCT/IPEA/416 Quillet 1992) 
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TRAITE DE CO 



RATION EN MATIERE DE BR 

PCT 



RAPPORT DE RECHERCHE INTERNATIONALE 
(article 18 et regies 43 et 44 du PCT) 



Reference du dossier du deposant ou 
du mandataire 

341015/18113 


POUR SUITE voir ,a notification de transmission du rapport de recherche internationale 
(formulaire PCT/ISA/220) et, le cas echeant, le point 5 ci-apres 

A DONNER 


Demande internationale n° 

PCT/FR 00/01734 


Date du depot international (jour/mois/annee) 

22/06/2000 


(Date de priorite (la plus ancienne) 
(jour/mois/annee) 

24/06/1999 


Deposant 

FRANCE TELECOM 



Le present rapport de recherche internationale, etabli par I'administration chargee de la recherche internationale, est transmis au 
deposant conformement a I'article 18. Une copie en est transmise au Bureau international. 

Ce rapport de recherche internationale comprend 3 feuilles. 

[X] II est aussi accompagne d'une copie de chaque document relatif a I'etat de la technique qui y est cite. 



1 . Base du rapport 

a. En ce qui concerne la langue, la recherche internationale a ete effectuee sur la base de la demande internationale dans la 
langue dans laquelle elie a ete deposee, sauf indication contraire donnee sous le meme point. 

| [ la recherche internationale a ete effectuee sur la base d'une traduction de la demande internationale remise a I'administration. 



b. 



En ce qui concerne les sequences de nucleotides ou d'acides amines divulguees dans la demande internationale (le cas echeant), 
la recherche internationale a ete effectuee sur la base du I i stage des sequences : 
[ | contenu dans la demande internationale, sous forme ecrite. 

deposee avec la demande internationale, sous forme dechiffrable par ordinateur. 
remis ulterieurement a I'administration, sous forme ecrite. 
re mis ulterieurement a I'administration, sous forme dechiffrable par ordinateur. 



□ 
□ 
□ 
□ 

□ 

□ 
□ 



La declaration, selon laquelle le listage des sequences presente par ecrit et fourni ulterieurement ne vas pas au-dela de la 
divulgation faite dans la demande telle que deposee, a ete fournie. 

La declaration, selon laquelle les informations enregistrees sous forme dechiffrable par ordinateur sont identiques a celles 
du listage des sequences presente par ecrit, a ete fournie. 

II a ete estime que certaines revendications ne pouvaient pas faire I'objet d'une recherche (voir le cadre I). 
II y a absence d'unite de I'invention (voir le cadre II). 



En ce qui concerne le titre, 

|~X~| le texte est approuve tel qu'il a ete remis par le deposant. 

f j Le texte a ete etabli par I'administration et a la teneur suivante: 



5. En ce qui concerne labrege, 

le texte est approuve tel qu'il a ete remis par le deposant 

□ le texte (reproduit dans le cadre III) a ete etabli par I'administration conformement a la regie 38.2b). Le deposant peut 
presenter des observations a I'administration dans un delai d'un mois a compter de la date cf expedition du present rapport 
de recherche internationale. 

6. La figure des dessins a publier avec I'abrege est la Figure n° 3 



[X| suggeree par le deposant. |~| Aucune des figures 

□ , . n'est a publier. 

parce que le deposant n'a pas suggere de figure. 

[ ] parce que cette figure caracterise mieux I'invention. 



Formulaire PCT/ISA/210 (premiere feuille) Quillet 1998) 
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inserted repetitions or blanks, and the discontinuities 
in the signal due to frames being eliminated amplify loss 
of quality which becomes highly perceptible and very 
disturbing for the listener. 
5 Furthermore, the use of a FIFO memory runs the risk 

of establishing a considerable delay in transmission and 
that also harms the overall quality of a call. 

The second method is much more complex to implement 
and requires a clock servo-control mechanism, and thus 

10 requires special hardware. However, it provides partial 
synchronization and therefore avoids problems associated 
with managing asynchrony. Nevertheless, that method 
adapts poorly to discontinuous transmission systems, to 
systems involving last frames, or to systems with high 

15 levels of jitter. Under such circumstances, 

synchronization information is no longer available. 
Furthermore, that method cannot be envisaged on terminal 
platforms where clock servo-control is not possible, as 
is the case in particular with PC type terminals, for 

2 0 example, where the system used for playing back sound is 
a sound card . 

Devices are already known from document WO/99 17 584 
for implementing a method in accordance with the preamble 
of claim 1, the devices having only one buffer memory. 
25 Document US-A 4 703 477 facilitates reading voice 

data by implementing a method of putting frames relating 
to the same voice data end-to-end. 



SUMMARY OF THE INVENTION 

30 A general object of the invention is to propose a 

solution to the problems associated with continuity in 
the playback of a speech signal in the presence of 
asynchronous transmission, and to do so by taking action 
at receiver level, i.e. at the end of the transmission 

3 5 system. 

To this end, the invention provides a method of 
managing the decoding and playback of a sound signal in 

CORRECTED SHEET 
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an asynchronous transmission system, in which any 
overabundance of filling of a first buffer memory and/or 
of a second buffer memory situated at the inlet or at the 
outlet of a decoding block is detected by comparing the 
5 filling level with at least one threshold, the method 
being characterized in that, depending on the value of 
the filling level: 

- voice activity detection is implemented and frames 
considered by said detection as being non-active are 

10 eliminated; and 

- concatenation processing is implemented on two 
successive frames to compact them into a pseudo- frame of 
length less than or equal to one frame, the length 
reduction ratio of the pseudo- frame relative to the 

15 length of the two frames being greater than or equal to 
two . 

Such a method is simple to implement and provides a 
guarantee of quality by avoiding excessive increase in 
transmission delay and by managing holes in the speech 
2 0 signal effectively. Furthermore, it does not imply any 
specific hardware servo-control circuit, and can 
therefore be quickly adapted to different asynchronous 
networks, terminals, and platforms. 

The method is advantageously associated with the 

2 5 various characteristics below taken singly or in any 

technically feasible combination: 

- voice activity detection is implemented and frames 
considered by said detection as being not active are 
eliminated whenever the filling level lies between a 

3 0 first threshold and a second threshold, and in that 

concatenation processing is implemented on two successive 
frames whenever the filling level lies between a second 
threshold and a third threshold; 

- the first and second thresholds are the same; 

35 - detection is performed at the inlet or the outlet 

of a decoding block having a first buffer memory at its 
inlet and/or its outlet to determine whether any frame is 
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missing or erroneous or whether any samples to be played 
back are absent, and a fake frame is generated to ensure 
continuity in the audio playback on detecting such a 
missing or erroneous frame, or on detecting such an 
5 absence of samples for playback; 

- when the decoding block implements its decoding 
processing in cyclical manner relative to the content of 
the first buffer memory, detection of any missing or 
erroneous frame or of any absence of samples to play back 
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CLAIMS 

1/ A method of managing the decoding and playback (14) of 
a sound signal in an asynchronous transmission system, in 
which any overabundance of filling of a first buffer 
memory (11) and/or of a second buffer memory (13) 
situated at the inlet or at the outlet of a decoding 
block (12) is detected by comparing the filling level 
with at least one threshold, the method being 
characterized in that, depending on the value of the 
filling level : 

- voice activity detection is implemented and frames 
considered by said detection as being non-active are 
eliminated; and 

- concatenation processing is implemented on two 
successive frames to compact them into a pseudo- frame of 
length less than or equal to one frame, the length 
reduction ratio of the pseudo- frame relative to the 
length of the two frames being greater than or equal to 
two . 

2/ A method according to claim 1, characterized in that 
voice activity detection is implemented and frames 
considered by said detection as being not active are 
eliminated whenever the filling level lies between a 
first threshold and a second threshold, and in that 
concatenation processing is implemented on two successive 
frames whenever the filling level lies between a second 
threshold and a third threshold. 

3/ A method according to claim 2, characterized in that 
the first and second thresholds are the same. 

4/ A method according to any preceding claim, 
characterized in that detection is performed at the inlet 
or the outlet of a decoding block (12) having a first 
buffer memory (11) at its inlet and/or its outlet to 
determine whether any frame is missing or erroneous or 
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whether any samples to be played back are absent, and a 
fake frame is generated to ensure continuity in the audio 
playback on detecting such a missing or erroneous frame, 
or on detecting such an absence of samples for playback. 

5/ A method according to claim 4, characterized in that 
when the decoding block (12) implements its decoding 
processing in cyclical manner relative to the content of 
the first buffer memory. (11)., detection of any missing or 
erroneous frame or of any absence of samples to play back 
is implemented at the same cyclical frequency, said 
detection taking place far enough in advance relative to 
the decoding process to make it possible to generate a 
fake frame in good time. 

6/ A method according to claim 4 or claim 5, 
characterized in that a fake frame is not generated when 
a missing or erroneous frame is detected for a frame on 
which an absence of samples has already been detected. 

7/ A method according to any one of claims 4 to 6 , 
characterized in that, for a system of the type which can 
voluntarily stop sending frames, the type of the 
previously-generated frame is stored from one frame to 
the next, and this information is used to determine 
whether to generate fake frames or to generate frames of 
silence . 

8/ A method according to any preceding claim, 
characterized in that in processing for concatenating two 
successive frames, the samples are weighted in such a 
manner as to give more importance to the first samples of 
the first frame and to the last samples of the second 
frame . 

9/ A method according to any preceding claim, 
characterized in that the threshold (s) is/are adaptive. 
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10/ A method according to claim 9, characterized in that 
a threshold is adapted as a function of the length of 
time passed with a filling level above a given threshold. 

11/ A device for playing back a speech signal, the device 
comprising a first buffer memory (11) receiving coded 
frames, means implementing decoding processing (12) on 
the frames stored in said first buffer memory (11) , a 
second buffer memory (13) receiving decoded frames output 
by the decoding means, and sound playback means (14) 
receiving the frames output by the second buffer memory 
(13), the device being characterized in that it further 
comprises means for implementing the method according to 
any preceding claim. 
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La deuxieme methode est, elle, beaucoup plus complexe et 
demande un mecanisme d'asservissement d'horloge et done un materiel 
specifique. Par contre, elle assure un synchronisme partiel et evite done les 
problemes de gestion d f asynchronisme. Neanmoins, cette methode 
5 s'adapte mal a des systemes de transmission discontinue, a des systemes 
avec pertes de trames et aussi a des systemes avec forte gigue. Dans ces 
cas, ('information de synchronisation n'est plus disponible. De plus, cette 
methode n'est pas envisageable sur des plates-formes de terminaux ou 
Tasservissement de I'horloge n'est pas possible, comme c ? est notamment le 

1 0 cas avec des terminaux de type PC par exemple ou le systeme de rendu 
acoustique utilise serait la carte son. 

On connait deja par le document WO/99 17 584 des descriptifs 
mettant en oeuvre un procede selon le preambule de la revendication 1 , ces 
dispositifs n'ayant qu'une memoire tampon. 

15 Le document US-A-4 703 477 facilite la lecture d'informations 

vocales en mettant en oeuvre un procede de mise bout a bout de trames 
relatives a la meme information vocale. 



PRESENTATION DE ^INVENTION 

20 

Un but general de I'invention est de proposer une solution aux 
problemes de continuity du rendu du signal de parole en presence d f une 
transmission asynchrone, et ceci en agissant au niveau du recepteur, e'est 
a dire a la fin de la chaine de transmission. 

25 A cet effet, {'invention propose un procede pour la gestion du 

decodage et de la restitution d'un signal sonore, dans un systeme de 
transmission asynchrone, selon lequel on detecte une eventuelle 
surabondance de remplissage d'une premiere memoire tampon et/ou cfune 
deuxieme memoire tampon situee(s) en entree ou en sortie d'un bloc de 

30 decodage en comparant le taux de remplissage a au moins un seuil, 
caracterise en ce que, selon la valeur du taux de remplissage, 

- on met en oeuvre une detection d'activite vocale et on supprime 
les trames considerees comme non actives par cette detection, 
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- on met en ceuvre un traitement de concatenation sur deux trames 
successives pour les compacter en une pseudo-trame de longueur 
inferieure a celle d'une trame, le rapport de redaction de la longueur de la 
pseudo-trame par rapport a la longueur des deux trames etant superieur ou 
egal a deux. 

Un tel procede est simple a mettre en oeuvre et assure une garantie 
de qualite en evitant d'accroTtre excessivement le retard de transmission et 
en gerant efficacement les trous dans le signal de parole. De plus, il 
n'implique aucun circuit tfasservissement hardware specifique, et peut done 
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REVENDICATIONS 

1. Procede pour la gestion du decodage et de la restitution (14) d'un 
signal sonore, dans un systeme de transmission asynchrone, selon lequel on 
detecte une eventuelle surabondance de remplissage d'une premiere memoire 

5 tampon (11) et/ou d'une deuxieme memoire tampon (13) situee(s) en entree ou 
en sortie d'un bloc de decodage (12) en comparant le taux de remplissage a au 
moins un seuil, caracterise en ce que, selon la valeur du taux de remplissage, 

- on met en oeuvre une detection d'activite vocale et on supprime les 
trames considerees comme non actives par cette detection, 
10 - on met en oeuvre un traitement de concatenation sur deux trames 

successives, pour les compacter en une pseudo-trame de longueur inferieure a 
celle d'une trame, le rapport de reduction de la longueur de la pseudo-trame 
par rapport a la longueur des deux trames etant superieur ou egal a deux. 

2. Procede selon la revendication 1, caracterise en ce qu'on met on 
is met en oeuvre une detection d'activite vocale et on supprime les trames 

considerees comme non actives par cette detection, lorsque le taux de 
remplissage est compris entre un premier et un deuxieme seuil et en ce qu'on 
met en oeuvre un traitement de concatenation sur deux trames successives, 
lorsque le taux de remplissage est compris entre un deuxieme et un troisieme 
2 o seuils. 

3. Procede selon la revendication 2, caracterise en ce que le premier et 
le deuxieme seuils sont confondus. 

4. Procede selon Tune des revendications precedentes, caracterise en 
ce qu'on detecte en entree ou en sortie d'un bloc de decodage (12) comportant 

2 5 une premiere memoire (11) tampon en entree et/ou en sortie une eventuelle 

trame manquante ou erronee ou une eventuelle absence d'echantillons a 
restituer et on genere une fausse trame qui assure la continuity du rendu audio 
lorsqu'une telle trame manquante ou erronee ou une telle absence 
d'echantillons a restituer est detectee. 

3 0 5. Procede selon la revendication 4, caracterise en ce que dans le cas 

ou le bloc de decodage (12) met en oeuvre de fa?on cyclique son traitement de 
decodage par rapport au contenu de la premiere memoire tampon (11), on met 



FEUILLE MODIFIEE 



This Page Blank (uspto) 



23-07-2001 



FR0001734 



29 

en oeuvre avec la meme frequence cyclique la detection d'une eventuelle trame 
manquante ou erronee ou d'une eventuelle absence d'echantillons a restituer, 
cette detection intervenant suffisamment en avance par rapport au traitement 
de decodage de fagon a permettre une generation de fausse trame en temps 
5 voulu. 

6. Procede selon Tune des revendications 4 et 5, caracterise en ce 
qu'on ne genere pas de fausse trame lorsqu'une detection de trame manquante 
ou erronee intervient sur une trame pour laquelle une absence d'echantillons a 
deja ete detectee. 

10 7. Procede selon Tune des revendications 4 a 6, caracterise en ce que 

dans le cas ou le systeme est d'un type qui peut arreter volontairement 
d'emettre des trames, on memorise d'une trame a I'autre le type de trame 
precedemment generee et on determine en fonction de cette information s'il 
faut generer des fausses trames ou des trames de silence. 

15 8. Procede selon Tune des revendications precedentes, caracterise en 

ce que dans un traitement de concatenation de deux trames successives on 
pondere les echantillons de fagon a donner plus d'importance aux premiers 
echantillons de la premiere trame et aux derniers echantillons de la deuxieme. 

9. Procede selon Tune des revendications precedentes, caracterise en 
20 ce que le (ou les) seuil(s) est (ou sont) adaptatif(s). 

10. Procede selon la revendication 9, caracterise en ce que 
('adaptation d'un seuil est fonction du temps passe avec un taux de 
remplissage superieur a un seuil donne. 

11. Dispositif de restitution d'un signal de parole comportant une 
25 premiere memoire tampon (11) recevant des trames codees, des moyens 

mettant en oeuvre un traitement de decodage (12) sur les trames memorisees 
dans ladite premiere memoire tampon (11), une deuxieme memoire (13) 
tampon recevant des trames decodees en sortie des moyens de decodage, des 
moyens de restitution sonore (14) recevant les trames en sortie de la 
30 deuxieme memoire tampon (13), caracterise en ce qu'il comporte en outre des 
moyens pour mettre en oeuvre le procede selon Tune des revendications 
precedentes. 
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(57) Abstract: Hie invention concerns a method for decoding and retrieving a sound signal in an asynchronous transmission system 
1^ which consists in detecting an backfilling overload in said buffer memory and/or a second memory in the input or the output of the 
fv| decoding unit and comparing the backfilling rate to at least a threshold. The invention is characterised in that, depending on the value 

of the backfilling rate, it consists in using a detection of voice activity and in eliminating the frames considered as being non-active 

by said detection; carrying out a concatenation processing on two successive frames. 



(57) Abrege: ProceVie' pour la gestion du decodage et de la restitution d'un signal sonore, dans un systeme de transmission asyn- 
chrone, selon lequel on detecte une eventuelle surabondance de remplissage de ladite memoire tampon et/ou d'une deuxieme m€- 
moire tampon en entree ou en sortie du bloc de decodage en comparant le taux de rem pi is sage a au moins un seuil, caractertse en ce 
que, selon la valeur du taux de remplissage, on met en oeuvre une detection d'activite* vocale et on supprime les trames considerees 
comme non actives par cette detection, on met en oeuvre un traitement de concatenation sur deux trames successive^. 
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— Avant I 'expiration du delai prevu pour la modification des 
revendications, sera republiee si des modifications sont 
revues. 



En ce qui concerne les codes a deux lettres et autre s abrevia- 
tions, se referer aux "Notes explicatives relatives aux codes et 
abreviations" figurant an debut de chaque numero ordinaire de 
la Gazette du PCX 
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PROCEDE POUR LA GESTION PU DECODAGE ET DE LA 
RESTITUTION D'UN SIGNAL SONORE DANS UN SYSTEME PE 
TRANSMISSION ASYNCHRONE 

5 La presente invention est relative a un procede de gestion de 

Tasynchronisme d'une transmission audio. 

PRESENTATION GENERALE DU DOMAINE DE ^INVENTION 

10 De fa9on generale, ('invention se rapporte aux systemes de 

transmission utilisant des codeurs de parole a debit reduit, dans lesquels les 
signaux ne transported pas I'horloge de reference du systeme de codage 
de la source (frequence d'echantillonnage du codeur). Ceci est le cas par 
exemple pour les transmissions de type IP (protocole internet) ou encore 

15 pour les transmissions discontinues, etc. 

Un but general de invention est de resoudre les problemes de 
production de flux continu de parole ou de son decodes rencontres avec de 
tels systemes. 

Traditionnellement les reseaux de communications telephoniques et 
20 de voies sons ont utilise des systemes de transmission analogiques et de 
multiplexage par repartition en frequence (groupe primaire, modulation 
d'amplitude et de frequence). Dans ces conditions, le signal de parole (ou 
de musique ; le terme parole sera utilise de maniere generique dans la suite 
de ce document) est converti en signal electrique par un microphone et c'est 
25 ce signal analogique qui est filtre et module pour etre presente au recepteur 
qui Tamplifiera avant de le presenter au systeme de restitution (ecouteur, 
haut-parleur, etc.). 

Depuis un certain nombre d'annees, les techniques de transmission 
et de commutation numerique ont peu a peu remplace les techniques 
30 analogiques. Dans ces systemes appeles MIC (modulation par impulsion 
ou PCM en anglais pour Pulse Code Modulation), le signal de parole est 
echantillonne et converti en numerique a Taide d'un convertisseur 
numerique analogique (CNA dans la suite) pilote par une frequence 
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d'echantillonnage fixe derivee d'une horloge maitresse delivree par le 
reseau et connue egalement du systeme de reception. C'est le cas pour les 
URA et URN (Unite de raccordement d'abonne analogique et numerique) du 
reseau de telecommunications. Le signal numerique re?u par le destinataire 
5 (au sens large) est converti en analogique afin de pouvoir etre ecoute a 
I'aide d'un convertisseur numerique analogique (CNA dans la suite) pilote 
par une horloge de meme frequence que celle utilisee par le CAN de la 
source. Dans ces conditions, le systeme complet est parfaitement 
synchrone et c'est le cas generalement des systemes actuels de 

10 commutation et de transmission. Ceux ci peuvent inclure des systemes de 
reduction de debit (par exemple pour le signal telephonique, passer de 64 
kbit/s a 32, 16 ou 8 kbit/s). C'est le reseau (ou les systemes terminaux 
comme par exemple dans le cas du RNIS (ISDN en anglais)) qui se charge 
des operations de CAN, de codage, de decodage (codage et decodage pris 

15 ici dans le sens reduction de debit) et de CNA. Les horloges sont toujours 
distributes et la chaTne CAN, codeur de parole, transmission et 
commutation, decodeur de parole et finalement CNA est parfaitement 
isochrone. II n'y a pas de pertes ou de repetitions d'echantillons de parole 
dans le decodeur. 

20 Les techniques de transmissions synchrones decrites 

precedemment necessitent la presence d'une horloge de reference dans 
tout le reseau. De plus en plus, les techniques de transmission (de 
donnees dans un premier temps) font appel a des techniques asynchrones 
et par paquets (protocole IP, ATM). Dans de nombreuses nouvelles 

25 situations, le decodeur n'a plus aucune reference concernant la frequence 
d'echantillonnage utilisee par le codeur et doit reconstituer par ses propres 
moyens une horloge de decodage qui essaye de suivre la reference au 
codeur. La presente invention est done particulierement interessante pour 
les systemes de telephonie sur relais de trame ("FRAME RELAY" selon la 

30 terminologie anglo-saxonne), pour la telephonie sur ATM ou pour la 
telephonie sur IP. La technique presentee peut etre facilement utilisee dans 
d'autres domaines de transmission de la parole ou des sons pour lesquels il 
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rVy a pas de transmission effective de la reference d'horloge du codeur vers 
le decodeur. 

PRESENTATION DE L'ETAT DE LA TECHNIQUE 

5 

Expose du probleme general 

Le probleme general pose par les systemes de transmission 
auxquels s'appliquent Tinvention est de pallier le fait que le decodeur de 
10 parole ou de son ne possede pas de reference d'horloge liee au codage de 
la source. 

On peut a cet egard distinguer deux cas : ceux correspondant a un 
« asynchronisme faible » et ceux correspondant a un « asynchronisme 
fort ». 



« U asynchronisme faible » 

A titre illustratif, on se place dans le cas d'un systeme de 
transmission qui comporte, ainsi qu'illustre schematiquement sur la figure 
20 1 : 

- une source de codage 1 comprenant un convertisseur analogique 
numerique pilote par une horloge de reference de frequence Fcan egale a 8 
kHz (pour fixer les elements de calcul dans la suite de la presentation) et un 
codeur de parole (plus ou moins complexe et reduisant de maniere plus ou 

25 moins importante le debit a transmettre) ; 

- un systeme de transmission asynchrone (schematise par la liaison 
2) qui transmet les informations produites par la source de codage en 
utilisant sa propre horloge de transmission et ses propres protocoles (par 
exemple, on peut imaginer que le codeur de parole produit un debit de 8 

30 kbit/s et que le systeme de transmission est constitue par une liaison de 
type asynchrone RS.232 a 9600 bit/s) ; 

- un systeme de reception et de decodage 3 recevant les 
informations transmises par la liaison asynchrone (dont le debit doit etre 
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evidemment un peu plus eleve que le debit brut de codage, par exemple 
9600 bit/s au lieu de 8000 bit/s) et charge de produire le signal apres un 
decodage (decompression) et en envoyant le signal produit vers un 
convertisseur numerique analogique connecte a un transducteur de type 
5 haut-parleur, combine telephonique, casques ou carte son installee dans un 
PC. 

On comprend que puisque le systeme de reception et de decodage 
3 ne dispose d'aucune reference d'horloge, il doit mettre en ceuvre une 
strategie afin de pallier ce manque de synchronisation entre le codeur et le 
10 decodeur. 

Quelque soit la technique de codage utilisee ou le type de 
transmission qui ne transporte pas directement une horloge, des marqueurs 
temporels dans la trame transmise ou des indications sur les instants de 
transmission, on peut ramener le probleme evoque precedemment (en 
15 faisant abstraction du codeur de parole, du systeme de transmission 
asynchrone et du decodeur de parole) a un systeme comprenant, ainsi 
qu'illustre sur la figure 2 : 

- un convertisseur analogique numerique 4 charge de convertir 
d'analogique en numerique des sons ou des signaux de parole a une 

20 frequence d'echantillonnage fixee par un oscillateur local ; 

- un convertisseur numerique analogique 5 charge de reproduire les 
sons vers un transducteur approprie au domaine d'utilisation concerne et 
qui fonctionne sur une frequence d'echantillonnage donne par un oscillateur 
local a priori de meme frequence mais qui n'est jamais exactement a la 

25 meme frequence pour des couts de realisation tolerable (il existe des 
sources de frequence tres stables et tres precises mais elles doivent etre 
compensees en temperature et leur cout est redhibitoire pour des 
realisations industrielles de grand volume) ; 

- un registre numerique 6 dans lequel le convertisseur analogique 4 
30 ecrit avec sa frequence d'echantillonnage (F C an), ce registre etant lu avec la 

frequence d'echantillonnage (F C na) du systeme de reproduction par le 
convertisseur numerique analogique (le CNA). 
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On comprend que puisque les deux horloges (de frequences F C an 
et F C na) sont differentes, de temps en temps le CNA va retire deux fois la 
meme information (si Fcna est superieure a Fcan) ou dans le cas contraire 
(Fcna est inferieure a Fcan) une information va etre ecrasee par le CAN 
5 avant que le CNA ne puisse la relire. 

Les oscillateurs que Ton trouve couramment dans le commerce sont 
caracterises par une precision de fonctionnement (dans une certaine 
gamme de temperature). 

Les oscillateurs a 50 ppm (partie par million) sont assez courants et 

10 servent de base au calcul suivant qui indiquera la frequence des pertes ou 
des repetitions d'echantillons pour une frequence d'echantillonnage de 8 
kHz (le lecteur pourra aisement calculer que pour des frequences 
d'echantillonnage plus elevees la frequence des sauts et des repetitions 
s'obtient dans le rapport des frequences d'echantillonnage ; plus la 

15 frequence d'echantillonnage est elevee et plus la frequence des sauts ou 
des repetitions sera elevee). 

Dans les conditions les moins favorables, on dispose d'un CAN 
fonctionnant a 8000*(1 + 50.e-6) et d'un CNA fonctionnant a 8000*(l -50.e- 
6). Dans cet exemple particulier, la periode des sauts (suppression 

20 d'echantillons dans le CNA puisque Fcna est inferieure a Fcan) est 
simplement calculee en comptant le nombre de periode du CNA (periode 
superieure a celle du CAN) qui produit une valeur egale a cette periode du 
CNA quand elle est multipliee par la difference des periodes. 

Soit Pcna la periode du CNA (ici 1/8000*(l - 50.e-6)) et Pcan la 

25 periode du CAN (ici 1/8000*(l + 50.e-6)) ; on doit done avoir N*(Pcna-Pcan) 
= Pcna. N represente le nombre d'operations elementaires qui se decalent 
de la difference de periodes. En posant 50e-6 = e et en appliquant les 
regies de simplification courantes pour les petits nombres, on obtient N = 
l/(2*e). Dans notre exemple cela donne immediatement la periode des 

30 sauts qui sera proche de 1.25 secondes. Si la precision des oscillateurs 
locaux est amelioree (par exemple en passant de 50.e-6 a 5.e-6) alors la 
periode des sauts augmentera (ici ce sera toutes les 12.5 secondes). 
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Ce phenomene de " glissement " d'une horloge par rapport a une 
autre va entrainer lorsque Ton se place dans un systeme complet de 
transmission avec des codeurs audio fonctionnant sur des trames de signal, 
des absences de trames de parole (aucune trame a decoder dans le temps 
5 imparti pour le decodage) ou une sur abondance de trames (deux trames a 
decoder au lieu d'une dans le temps imparti). En effet, en prenant I'exemple 
d'un codeur de parole fonctionnant avec des trames de 30 ms a 8 kHz, soit 
240 echantillons, au niveau du recepteur et plus particulier du decodeur on 
s'attend a recevoir dans un creneau temporel de 30ms, une trame a 

10 decoder, afin d'assurer la continuite du rendu de signal de parole. Or, si par 
exemple, Fcan est inferieur a Fcna, nous allons avoir, en prenant les 
hypotheses precedentes, une absence de trame d'echantillons a decoder 
par le systeme de restitution sonore toutes les 240 * 1,25 = 300 secondes, 
et a Tinverse deux trames au lieu d'une (soit une trame a « supprimer ») a 

15 decoder toutes les 300 secondes. Dans ce cas, le phenomene genant du 
saut ou de la repetition d'echantillons devient vraiment fort desagreable 
puisque c'est tout un bloc de signal qui est saute ou repete et necessite 
done une gestion adequate. 

20 « L'asvnchronisme fort » 

Certains types de transmissions amplifient ce probleme 
d'asynchronisrne du au phenomene de « glissement » des horloges 
explicite precedemment. C'est ce qu'on entend ici par « asynchronisme 
25 fort ». 

En effet, lorsque la transmission n'est pas parfaite et introduit des 
pertes d'echantillons ou de trames d'echantillons et aussi lorsque la 
transmission genere une gigue sur Tarrive des echantillons, non liees a 
Thorloge d'emission ou a Thorloge de reception, mais liee a d'autres 
30 mecanismes de la chaTne de transmission possedant leur propre horloge, le 
systeme de reception peut alors etre confronts a Tabsence de plusieurs 
trames, ou a la surabondance de plusieurs trames. Ceci est par exemple le 
cas pour des reseaux de type IP avec le phenomene de pertes de paquets 
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et celui de la gigue introduite lors du routage des paquets. Ces 
phenomenes vont fortement perturber la continuite du rendu acoustique du 
signal audio. En effet, dans le cas de pertes de paquets ou d'une gigue 
ayant retardee un ou plusieurs paquets, le systeme de rendu va se trouver 
5 sans aucun echantillon (ou aucune trame d'echantillons) a envoyer au CNA 
pour assurer la continuite du rendu acoustique. Et inversement, dans le cas 
d'une forte gigue, le systeme de restitutions peut se retrouver avec 
beaucoup trop de trames ou d'echantillons a envoyer en meme temps au 
CNA. En effet, en presence d'une forte gigue, la transmission des trames 

10 de signal sonores peut s'effectuer sous forme de rafales, creant ainsi de 
forts phenomenes de trous et de sur abondance de trames d'echantillons. 

On notera que lors de I'utilisation de codeurs de parole fonctionnant 
avec un systeme de transmission de type VAD/DTX/CNG (Voice Activity 
Detector/Discontinous Transmission/Comfort Noise Generation selon la 

15 terminologie anglo-saxonne), on introduit aussi un mecanisme qui est 
similaire au cas de la perte de paquet, puisqu'en cas de silence, I'emetteur 
cessera d'emettre des trames d'echantillons. L'arret d'emission 
d'echantillons peut en effet au niveau du recepteur etre assimile au 
phenomene de la perte de paquet ou encore au cas ou I'horloge du CAN est 

20 plus rapide que celle du CNA, ce qui amene comme cela a ete montre ci- 
dessus des trous dans le signal au niveau du recepteur. 

" L'asynchronisme fort " se distingue done de " I'asynchronisme 
faible " en impliquant non plus uniquement des sauts et/ou repetitions de 
manieres cycliques, mais aussi des trous dans le signal et/ou de la 

25 surabondance de signal et ceci de maniere non cyclique et multiple. 

Description des differentes methodes existantes. 

On connait principalement deux methodes pour pallier les 
30 inconvenients dus au fait que le decodeur de parole ou de son ne possede 
pas de reference d'horloges. 

La premiere consiste simplement a proceder comme cela a ete 
enonce dans les paragraphes decrivant " l'asynchronisme faible ", e'est a 
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dire en sautant ou en repetant des echantillons. Le systeme de decodage 
produit des echantillons a un rythme a peu pres egal a celui du codeur et 
les presente au convertisseur numerique analogique avec ce rythme (les 
moyens de realisation de ce systeme de reconstruction sont connus de 
5 I'homme de Tart). Dans certains cas, par exemple dans le cas 
"d'asynchronisme fort" avec transmission sous forme de frames, il est 
prefere en I'absence d'echantillons a jouer, renvoi de trames d'echantillons 
nulles au CAN, plutot que la repetition de la trame precedente. De plus, a 
I'inverse lors d'un surplus d'echantillons, ceux-ci ne seront pas supprimes 

10 directement, mais une FIFO d'une certaine taille pourra etre utilisee pour 
absorber en partie la gigue. Un remplissage trop important de cette FIFO 
declenchera une vidange partielle ou complete de cette FIFO creant ainsi a 
nouveau des sauts dans le rendu sonore. 

La deuxieme methode, plus elaboree et plus performante, necessite 

15 la mise oeuvre de boucle de recuperation d'horloge materielle asservie par 
I'etat de remplissage d'une memoire tampon du signal a decoder (ou a 
transmettre comme par exemple dans les AAL1 de I'ATM). Cette methode 
d'asservissement tente grace a la boucle de recuperation d'horloge de 
recuperer la frequence d'echantillonnage de la source. L'etat de 

20 remplissage du buffer de reception produit un signal de commande afin 
d'asservir une boucle PLL (numerique ou analogique). 

La premiere methode presente une extreme simplicity de realisation 
mais a un gros defaut lie a la qualite des sons reproduits. En effet, un saut 
ou une suppression toutes les 1 .25 secondes peut etre tres desagreable a 

25 I'ecoute, cas de " Tasynchronisme faible avec correction de 
I'asynchronisme au niveau de Techantillon. De meme, dans le cas d'un 
systeme fonctionnant avec des trames d'echantillons, les repetitions ou les 
blancs introduits, ainsi que les discontinues dans le signal par suppression 
de trames amplifient la degradation de qualite rendue fortement perceptible 

30 et fortement perturbante pour I'auditeur. 

De plus, avec Tutilisation d'une memoire premier entrant/premier 
sortant (FIFO), Ton risque de prendre un retard consequent dans la 
transmission, ce qui nuit aussi a la qualite globale de la communication. 
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La deuxierne methode est, elle, beaucoup plus complexe et 
demande un mecanisme d'asservissement d'horloge et done un materiel 
specifique. Par contre, elle assure un synchronisme partiel et evite done les 
problemes de gestion d'asynchronisme. Neanmoins, cette methode 
5 s'adapte mal a des systemes de transmission discontinue, a des systemes 
avec pertes de trames et aussi a des systemes avec forte gigue. Dans ces 
cas, I'information de synchronisation n'est plus disponible. De plus, cette 
methode n'est pas envisageable sur des plates-formes de terminaux ou 
I'asservissement de Thorloge n'est pas possible, comme e'est notamment le 
10 cas avec des terminaux de type PC par exemple ou le systeme de rendu 
acoustique utilise serait la carte son. 

PRESENTATION DE {.INVENTION 

15 Un but general de Tinvention est de proposer une solution aux 

problemes de continuity du rendu du signal de parole en presence d'une 
transmission asynchrone, et ceci en agissant au niveau du recepteur, e'est 
a dire a la fin de la chaTne de transmission. 

A cet effet, Tinvention propose un procede pour la gestion du 

20 decodage et de la restitution d'un signal sonore, dans un systeme de 
transmission asynchrone, selon lequel on detecte une eventuelle 
surabondance de remplissage de ladite memoire tampon et/ou d'une 
deuxierne memoire tampon en entree ou en sortie du bloc de decodage en 
comparant le taux de remplissage a au moins un seuil, caracterise en ce 

25 que, selon la valeur du taux de remplissage, 

- on met en oeuvre une detection d'activite vocale et on supprime 
les trames considerees comme non actives par cette detection, 

- on met en oeuvre un traitement de concatenation sur deux trames 
successives. 

30 Un tel procede est simple a mettre en oeuvre et assure une garantie 

de qualite en evitant d'accroTtre excessivement le retard de transmission et 
en gerant efficacement les trous dans le signal de parole. De plus, il 
n'implique aucun circuit d'asservissement hardware specifique, et peut done 
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s'adapter rapidement a des plates-formes, terminaux et reseaux 
asynchrones differents. 

Ce procede est avantageusement complete par les differentes 
caracteristiques suivantes prises seules ou selon toutes leurs combinaisons 
5 techniquement possibles : 

- on met on met en oeuvre une detection d'activite vocale et on supprime les 
trames considerees comme non actives par cette detection, lorsque le taux 
de remplissage est compris entre un premier et un deuxieme seuil et en ce 
qiTon met en oeuvre un traitement de concatenation sur deux trames 

10 successives, lorsque le taux de remplissage est compris entre un deuxieme 
et un troisieme seuils ; 

- le premier et le deuxieme seuils sont confondus ; 

- on detecte en entree ou en sortie d'un bloc de decodage comportant une 
premiere memoire tampon en entree et/ou en sortie une eventuelle trame 

15 manquante ou erronee ou une eventuelle absence d'echantillons a restituer 
et on genere une fausse trame qui assure la continuity du rendu audio 
lorsqu'une telle trame manquante ou erronee ou une telle absence 
d'echantillons a restituer est detectee ; 

- dans le cas ou le bloc de decodage met en oeuvre de fa?on cyclique son 
20 traitement de decodage par rapport au contenu de la premiere memoire 

tampon, on met en oeuvre avec la meme frequence cyclique la detection 
d'une eventuelle trame manquante ou erronee ou d'une eventuelle absence 
d'echantillons a restituer, cette detection intervenant suffisamment en 
avance par rapport au traitement de decodage de fa?on a permettre une 
25 generation de fausse trame en temps voulu ; 

- on ne genere pas de fausse trame lorsqu'une detection de trame 
manquante ou erronee intervient sur une trame pour laquelle une absence 
d'echantillons a deja ete detectee ; 

- dans le cas ou le systeme est d'un type qui peut arreter volontairement 
30 d'emettre des trames, on memorise d'une trame a I'autre le type de trame 

precedemment generee et on determine en fonction de cette information s'il 
faut generer des fausses trames ou des trames de silence ; 
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- dans un traitement de concatenation de deux trames successives on 
pondere les echantillons de fa?on a donner plus d'importance aux premiers 
echantillons de la premiere trame et aux derniers echantillons de la 
deuxieme ; 

5 - le (ou les) seuil(s) est (ou sont) adaptatif(s) ; 

- un seuil est fonction du temps passe avec un taux de remplissage 
superieur a un seuil donne. 

L'invention concerne egalement un dispositif de restitution d'un 
signal de parole comportant une premiere memoire tampon recevant des 

10 trames codees, des moyens mettant en oeuvre un traitement de decodage 
sur les trames memorisees dans ladite premiere memoire tampon, une 
deuxieme memoire tampon recevant des trames decodees en sortie des 
moyens de decodage, des moyens de restitution sonore recevant les 
trames en sortie de la deuxieme memoire tampon, caracterise en ce qu'il 

15 comporte en outre des moyens pour mettre en oeuvre le procede precite. 

Comme on le comprendra a la lecture de la description qui suit, ces 
moyens sont essentiellement des moyens informatiques. 

PRESENTATION DES FIGURES 

20 

D'autres caracteristiques et avantages de invention ressortiront 
encore de la description qui suit qui est purement illustrative et non limitative 
et qui doit etre lue en regard des dessins annexes sur lesquels : 

- la figure 1 est une representation schematique d'une chame de 
25 transmission asynchrone ; 

-.la figure 2 est un schema illustrant une moderation d'une telle 
chaTne de transmission ; 

- la figure 3 est un schema d'un dispositif de reception ; 

- la figure 4 illustre des signaux obtenus en mettant en oeuvre un 
30 traitement de concatenation propose par Tinvention. 
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DESCRIPTION DETA1LLEE D'UN OU PLUS1EURS MODES DE 
REALISATION 

Le procede de gestion de I'asynchronisme de la transmission 
5 propose par invention met en oeuvre deux traitements correspondant a la 
prise en charge des deux phenomenes precedemment exposes qui sont 
I'absence d'echantillons et le surplus d'echantillons. 

1. Presentation de la chaine de rendu sonore d une 
10 application classique de transmission, 

Ainsi que cela a ete illustre sur la figure 3, la chaTne de rendu du 
signal de parole se decompose en trois elements : 

- Un bloc 10 d'attente de reception d'echantillons ou de trames de 
15 codes provenant du reseau. Ce bloc 10 contient une memoire 11 de type 

FIFO ou memoire tampon de type circulaire (que Ton appellera " FIFO 1 " 
dans la suite du document) permettant de stocker temporairement les 
trames avant leur decodage. 

- Un bloc 12 de decodage qui prend les trames issues du bloc 10, 
20 les decode, et les stocke a son tour dans une memoire FIFO 13 (que Ton 

appellera " FIFO 2 " dans la suite du document). 

- Un bloc de rendu 14 qui va prendre les trames d'echantillons 
decodes, et les envoyer au systeme de rendu sonore 15 quel qu'il soit. 

Suivant les terminaux et I'organisation de cette chaine, la frequence 
25 de I'horloge de rendu sonore (celle du convertisseur numerique analogique 
Fcna) n'est pas forcement directement liee a tous ces blocs. Le bloc 14 
etant en liaison directe avec le systeme rendu, celui-ci est directement lie a 
la frequence Fcna. Les autres blocs peuvent etre en connexion plutot avec 
la cadence d'arrivee des trames en provenance du reseau qu'avec cette 
30 frequence Fcna. En effet, en prenant I'exemple d'un terminal pourvu d'un 
systeme multitaches, et ou chaque bloc serait effectue par une tache 
specifique, les taches 10 et 12 pourraient etre liees done a la reception de 
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trames. La tache 10 attend une trame du reseau, celle-ci est ensuite 
decodee par la tache 12 et placee dans la memoire H FIFO 2 ". 

Quant a la tache 14 cadencee par Fcna, elle va envoyer en allant 
puiser dans la memoire " FIFO 2 " des echantillons en continu au systeme 
5 de rendu sonore. 

On voit done qu'en cas " d'asynchronisme fort ou faible", e'est la 
gestion de la memoire " FIFO 2 " qui va demander un soin particulier. De 
meme, si la tache 12 avait ete liee fortement a la tache 14, cette fois cela 
aurait ete la memoire "FIFO 1 " qui aurait demande une attention 
10 particuliere. 

Le mecanisme conforme a un mode de mise en oeuvre de 
Tinvention va etre presente en appliquant la gestion sur la memoire " FIFO 
2", mais Ton verra au cours des explications comment le transposer 
moyennant certaines adaptations, a la gestion de la memoire " FIFO 1". 

15 

2. Absence d'echantillons 

Pour assurer un rendu sonore continu en cas d'absence 
d'echantillons, on traite en parallele les deux sources potentielles d'absence 
20 d'echantillons a restituer. La premiere correspond a reformation de pertes 
de paquets, et la seconde correspond a Tinformation d'absence 
d'echantillons a restituer (par exemple « FIFO 2 » vide), alors qu'il est 
necessaire d'envoyer des echantillons au systeme de rendu sonore. 

25 2.1 Perte de trames, ou trames erronees 

Le traitement sur les pertes de trames ou les trames erronees 
necessite de disposer d'un systeme de transmission donnant acces a 
reformation sur la perte de trames ou la reception de trames erronees. 
30 Ceci est souvent le cas, dans les systemes de transmission. 

Par exemple, pour des reseaux IP, il est possible d f utiliser le 
marquage des paquets de donnees issu de la couche RTP, qui donne le 
nombre exact d'echantillons perdus entre deux receptions de paquets de 
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codes audio. Cette information de pertes de trames ou dans le cas IP de 
perte de paquets (contenant une ou plusieurs trame de parole), ne sera 
generalement connue qu'a la reception du paquet suivant le ou les paquets 
perdus. 

5 II n'y a pas necessairement un interet a agir, alors qu'une ou 

plusieurs trames valides peuvent etre decodees. En fait, avec les codeurs 
de parole de nouvelle generation (codeurs CELP, codeurs par transformee, 
... ) dans un souci d'assurer un maintien de la qualite du rendu acoustique, il 
est souvent necessaire d'assurer un certain synchronisme entre le codeur et 

10 le decodeur. La perte de ce synchronisme codeur-decodeur peut etre 
compensee en utilisant des algorithmes de correction de pertes de trames 
liees au codeur de parole utilise. Ces algorithmes sont par exemple prevus 
dans la norme de certains codeurs de parole (ex : norme ITU G.723. 1). 
Avec Tutilisation de codeurs plus simples, ce mecanisme n'est pas 

1 5 forcement necessaire. 

Lorsqu'un grand nombre de trames a ete perdu, on peut limiter le 
nombre de " fausses " trames d'echantillons a generer pour eviter de remplir 
inutilement la memoire " FIFO 2 ". Le but du traitement de generation de 
fausses trames est de remplir les trous de maniere a assurer une continuity 

20 du signal, mais aussi a lisser les variables internes du decodeur pour eviter 
de trop grandes divergences lors du decodage de la trame valide suivant 
les trames invalides ou perdues, et ainsi eviter une discontinuity audible. 
Apres la generation de quelques trames Ton peut considerer les variables 
comme lissees, et done limiter cette generation de fausses trames a un petit 

25 nombre de trames (par exemple 4 a 6), lorsqu'un grand nombre de trames 
ont ete perdues. 

Comme on Taura compris, on asservit ainsi le traitement par rapport 
a reformation de pertes de trames. 

Un traitement similaire est mis en oeuvre par rapport a reformation 
30 de trames dites" trames non valides n . Cette information est transmise au 
decodeur par la partie reseau du recepteur et ce suffisamment tot pour 
permettre la mise en oeuvre d'un algorithme de corrections de trames qui en 
prenant en compte cette trame non valide permet d'assurer une continuity 
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du signal, ainsi que d'eviter une autre source d'absence d'echantillon dans 
la memoire " FIFO 2 

En resume, ce premier traitement correspond done a la gestion 
d'une information du type " n trames perdues" ou " trame re$ue non valide " 
5 venu de la couche reseau du recepteur. Cette gestion se caracterise par la 
mise en oeuvre d'un algorithme de correction de pertes de trames (aussi 
appele dans ce document algorithme de generation de "fausses" trames). 
Ce premier traitement agit done au niveau de la tache de decodage et 
alimente la memoire " FIFO 2 ". 

10 

2.2 Absence d'echantillons a restituer 

Ce deuxieme traitement est lie a I'horloge issue de la tache 14, e'est 
a dire a I'horloge de frequence Fcna. En effet, comme indique 

15 precedemment, la memoire « FIFO 2 » (ou « FIFO 1 » si la tache 12 est 
imbriquee a la tache 14 peut ne plus contenir d'echantillons alors qu'il est 
necessaire de fournir des echantillons au systeme de restitutions sonores. 
II convient done de fournir des echantillons a ce systeme de restitution, et si 
possible eviter de restituer des zeros (ceci degradant fortement le signal 

20 sonore). 

Ce deuxieme traitement peut s'analyser comme une boucle de 
retroaction sur le decodage des trames. Cette boucle declenche I'appel a 
I'algorithme de corrections de pertes de trames et doit de ce fait etre activee 
suffisamment tot pour permettre Texecution de Talgorithme et renvoi des 
25 echantillons au systeme de restitutions sonores. Suivant la plate-forme, 
Tappel a cette retroaction pourra etre different. 

Cette boucle peut etre mise en oeuvre des deux manieres qui vont 
maintenant etre decrites. 

Dans le cas d'un recepteur mono-tache (par exemple sur un DSP 
30 sans RTOS (Real Time Operating System selon la terminologie 
anglosaxonne), la partie decodeur audio est completement liee a Thorloge 
du CNA (Fcna), et est done en permanence en attente d'une trame a 
decoder de maniere cyclique. Par exemple, avec un codeur de parole 
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utiiisant des trames de 30 ms, on construit des boucles d'attentes de 
periode multiple de 30 ms. 

Ainsi, dans le cas d'une boucle de 30 ms, le decodeur va, toutes les 
30 ms, etre en attente d'une trame a decoder placee dans la memoire 
5 "FIFO 1" (ce qui peut juste correspondre au passage d'une trame de la 
couche reseau a la tache 12. A I'arrivee de celle-ci, il la decode et la place 
dans la memoire " FIFO 2 " pour I'envoi au CNA. Le traitement de 
retroaction sera mis en oeuvre par constatation a T=TO+30 ms - Tc de 
I'absence de trame a decoder dans la memoire " FIFO 1", 
10 ou TO = temps du debut de la boucle d'attente de 30 ms, 

et Tc = temps d'execution de I'algorithme de generation de fausses trames 
avec une marge supplemental correspondant aux interruptions et/ou aux 
autres traitements annexes pouvant avoir lieu avant la fin de la boucle. 

Le traitement est done mis en oeuvre avec la butee temporelle 
15 d'attente Tb (temps de boucle) - Tc (temps de calcul + marge). 

Dans le cas d'un recepteur multitache (cas d'un terminal PC par 
exemple), le temps n'est pas gere de maniere aussi precise et done un 
traitement un peu different doit alors etre mis en oeuvre. (Remarque : ce 
traitement reste assez proche du precedent, car il cherche aussi a prendre 
20 en compte le temps Tc). 

Dans un tel cas, on ne dispose souvent que de boucles d'attente 
liees a des evenements, par exemple le fait que des paquets aient ete regus 
par le reseau, ou encore le fait que la memoire tampon " n " (contenant une 
ou plusieurs trames d'echantillons) envoyee precedemment au systeme de 
25 restitution sonore a ete lue par le CNA, et est done a nouveau disponible 
pour nouvel envoi au CNA. 

Suivant I'implantation et la necessite de repondre rapidement ou non 
a Pevenement, il est possible de marquer une temporisation avant le 
remplissage de cette memoire tampon pour re-emission vers le CNA. Cette 
30 temporisation est choisie de fa?on a laisser suffisamment de temps pour 
Texecution de I'algorithme de generation de " fausses " trames (si besoin). 

Puis, a Tissue le cas echeant de cette temporisation, le traitement 
verifie la presence de suffisamment d'echantillons dans *' FIFO 2 " 
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(remarque : cela peut etre dans " FIFO 1 " si la gestion est placee a ce 
niveau), et dans le cas contraire demande la generation du nombre de 
fausses trames adequat pour remplir la memoire tampon " n 

Dans le cas ou le systerne est tel qifil faut remplir "immediatement" 
5 la memoire tampon "n", le controle de la disponibilite d'echantillons et I'appel 
eventuel au traitement de generation de " fausses trames " sont mis en 
oeuvre directement apres chaque envoi de la memoire tampon au CNA, afin 
que les echantillons generes soient deja dans la memoire " FIFO 2 " lors de 
I'evenement " memoire tampon " n " disponible". 

10 Ainsi, quel que soit le recepteur, le traitement constate I'absence 

d'echantillons a envoyer au systerne de restitutions sonores en mettant en 
oeuvre un controle du remplissage de la memoire tampon "FIFO 2" (ou 
"FIFO 1 " suivant la gestion de la chalne de rendu sonore) et active 
Talgorithme de generation de " fausses " trames pour generer les 

15 echantillons manquants. 

Comme on I'aura compris, le deuxieme traitement repond d'abord 
au probleme de " glissement " des horloges, et plus precisement au cas ou 
Thorloge de reception (Fcna) est plus rapide que I'horloge d'emission 
(Fcan). II intervient aussi vis-a-vis du phenomene de pertes de trames, car 

20 celui-ci peut amener une absence d'echantillons a envoyer au CNA avant 
que ne soit detectee la perte de trames, cette detection n'intervenant qu'a la 
reception de la trame suivant la perte. 

Pour Her les actions du premier et du deuxieme traitement, on 
interdit au premier traitement de generer des " fausses " trames lors d'une 

25 detection de pertes de trames, si les trames correspondantes viennent 
d'etre generees par le deuxieme traitement . 

On utilise a cet effet des drapeaux, ainsi que des compteurs 
determinant le nombre d'echantillons generes par le deuxieme traitement. 



30 
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2.3. Actions specifiques dans le cas de codeurs de parole utilisant la 
fonctionnalite VAD/DTX/CNG. 

Des codeurs utilisant un systeme VAD/DTX/CNG peuvent arreter 
5 volontairement d'emettre des trames ; dans ce cas, I'absence d'echantillons 
ne doit pas etre consideree exactement comme une perte de trames, mais 
comme un moment de silence. Le seul moyen de determiner si la trame a 
generer doit etre du silence ou correspond a une trame perdue, est de 
connaitre le type de la trame precedemment generee (soit trame de signal 

10 ou trame correspondante a une trame perdue (FSF), soit trame de mise a 
jour du bruit (SID), soit trame de silence (NOT)) A cet effet, on memorise le 
type de trame generee, et on determine lors de la generation de trames 
pour absence de trame ou perte de trame, s'il faut generer des fausses 
trames issues de I'algorithme de corrections de pertes de trames, (cas de la 

15 trame precedente de type FSF), ou des trames de silence en activant le 
decodeur de maniere adequate (cas de la trame precedente SID ou NOT). 

3. Surabondance d'echantillons a restituer. 

20 Pour traiter le cas de surabondance d'echantillons a restituer, on 

met en oeuvre un traitement de vidange des trames, avec suppression 
partielle ou complete de certaines trames avant leur eventuelle prise en 
compte par le systeme de rendu sonore. 

Ce traitement permet une memorisation des trames dans les 

25 memoires tampons jusqu'a certains seuils declenchant des actions pour 
limiter cette memorisation et la prise de retard sur la chaine de 
communication qu'elle implique. Cette memorisation limitee permet en effet 
de tenir compte des phenomenes de gigues de reception de trame en rafale 
et de glissement d'horloge tout en limitant le retard de transmission. 

30 
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3.2 Traitement de vidanqe 

^accumulation de trames est d'abord detectable au niveau de la 
memoire " FIFO 1 puis est ensuite reportee au niveau de la memoire 
5 « FIFO 2 ». 

Le procede propose gere reformation du remplissage d'une 
memoire tampon de reference, c'est a dire « FIFO 1 » ou " FIFO 2 " suivant 
I'implantation des taches 10, 12 et 14 (explicitees precedemment) dans le 
recepteur. En effet, si les taches 12 et 14 sont liees, Tinformation de 

10 remplissage qui est utilisee par le procede est celle relative a la memoire " 
FIFO 1 " qui fait tampon entre le reseau et le systeme de rendu sonore. De 
la meme fa?on, si les taches 10 et 12 sont liees, c'est la memoire " FIFO 2 " 
qui fait tampon et done c'est son taux de remplissage qui est pris en 
consideration pour le traitement de gestion. 

15 Le traitement va maintenant etre explicite en se plagant dans le 

deuxieme cas de figure. Le premier cas s'en deduit de fagon immediate par 
transposition. 

Afin de conserver au mieux une synchronisation entre le codeur et le 
decodeur et done une restitution sonore optimale, on choisit de decoder 

20 toutes les trames venant du reseau. Le traitement decide en fonction de 
I'information de remplissage Taction liee a la trame decodee. Cette action 
est detaillee par la suite. Pour activer le traitement, des seuils de 
remplissage sont utilises. Ces seuils definissent des niveaux d'alarme de 
remplissage de la " FIFO Pour agir de maniere la moins audible possible 

25 (e'est-a-dire pour limiter la degradation de qualite), deux niveaux d'actions 
sont choisis. Un premier niveau (niveau d'alarme 1) correspond a un niveau 
non critique de remplissage excessif (loin du remplissage maximal tolere), 
le second (niveau d'alarme 2) correspond lui a une action obligatoire sur 
chaque trame (moyennement proche du remplissage maximal tolere). Un 

30 troisieme niveau (niveau d'alarme 3), dit de securite (pour eviter des 
debordements de memoire, ou autre probleme) a ete defini. II correspond a 
un remplissage proche du maximal tolere. Ce niveau d'alarme n'est en fait 
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jamais atteint si les actions des deux seuils precedents sont bien effectuees 
et si fes seuils sont correctement definis. 

Lors de chaque decodage, rinformation de remplissage est 
comparee aux seuils pour connaTtre I'etat de la " FIFO " (en alarme ou non), 
5 et le cas echeant le niveau de I'alarme. 

Si I'etat obtenu, n'est pas un etat d'alarme, aucune action est 
effectuee, et la trame decodee est stockee dans " FIFO 2 ". 

Dans le premier etat d'alarme, on considere qu'au moins 50% du 
signal issu d'une conversation est inutile ; on supprime done, dans ce 
0 niveau d'alarme, toutes les trames ne presentant que tres peu 
d'informations. Pour cela, ce traitement peut mettre en oeuvre un DAV 
simple (DAV = Detecteur d'Activite Vocale) qui scrute toutes les trames 
d'echantillons apres leur decodage et permet de decider de leur ecriture ou 
non dans " FIFO 2 Le traitement peut aussi decider a partir d'informations 
5 directement puisees dans la trame de codes de I'importance ou non de 
I'information qu'elle contient. Dans cet etat d'alarme, toute trame 
consideree comme ne contenant que du bruit, ne sera pas stockee dans " 
FIFO 2 " pour une future restitution sonore. 

Dans le second etat d'alarme (niveau critique), il est necessaire 
d'agir sur chaque trame pour limiter tres fortement I'accroissement du 
remplissage de la memoire " FIFO 2 ". A ce niveau le traitement precedent 
(e'est a dire celui mis en oeuvre pour le niveau d'alarme 1) reste actif. Mais 
cette fois, il est impose de reduire deux trames consecutives a une trame ou 
moins. Une decision est done prise a partir de deux trames d'echantillons 
non " silencieuses " (en effet, si une trame est " silencieuse elle n'est tout 
simplement pas ecrite dans " FIFO 2 " (cas de I'etat d'alarme 1 inclus dans 
I'etat d'alarme 2)). L'action sur deux trames consecutives n'est done 
engagee que lorsqu'une trame est detectee comme non « silencieuse ». 
Cette trame est d'abord memorisee, ensuite si la seconde trame est " 
silencieuse ", alors e'est cette premiere trame qui est ecrite dans " FIFO 2 ". 

Dans le cas ou les deux trames contiennent des informations 
importantes, il convient de remplacer ces deux trames par une seule 
minimisant la perte d'information et la degradation de qualite. C'est cette 
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trame resultante qui sera stockee dans « FIFO 2 ». Toute solution efficace 
pouvant effectuer cette tache peut etre utilisee et activee dans ces 
conditions (second etat d'alarme, et deux trames non « silencieuses »). 
Deux exemples d'algorithmiques pour effectuer cette tache sont presentes 
5 ci-dessous. 

Selon une premiere solution d'algorithmique, on remplace les deux 
trames bout a bout par une seule trame ou chaque coefficient xj (avec j 
allant deOa N-1 (N nombre d'echantillons par trame)) prend la valeur (Xj + 
x l+ i)/2 (avec i allant de 0 a 2*N-1, les Xj provenants des deux trames 

10 originales). Cette solution revient en quelque sorte a faire du sous 
echantillonnage lisse. La frequence du signal restituee est alors double sur 
cette trame. Cependant, ii a ete constate par les inventeurs que lorsque 
Tetat d'alarme 2 n'est pas tres frequent, cette solution suffit pour maintenir la 
qualite du rendu sonore. 

15 Selon une deuxieme solution, on met en oeuvre une detection de la 

hauteur du signal pour compacter les deux trames en une pseudo-trame de 
longueur inferieure ou egale a celle d'une trame. Le nombre d'echantillons 
contenus dans cette pseudo-trame est determine par ['information de 
frequence de fondamental ("pitch" selon la terminologie anglo-saxonne), 

20 mais est de toute maniere inferieure ou egale a la longueur d'une trame 
normale, tout en etant proche de cette longueur de trame. L'algorithme 
utilise permet d'assurer une continuity du signal de rendu sans trou audible, 
ni doublement de frequence, tout en divisant le stockage du signal d'un 
facteur superieur ou egal a 2. Ceci est explicite plus en details au 

25 paragraphe 3.4 ci-apres. De plus, il minimise aussi ainsi la perte 
dlnformations sonores, en supprimant en fait moins de 50 % de 
information. 

On notera que dans le cas ou le recepteur met en oeuvre son 
traitement a partir d'une analyse de " FIFO 1 ", le decodeur etant 
30 directement relie au systeme de rendu sonore, il se doit de generer un 
nombre d'echantillons suffisants, soit dans notre cas d'assurer la mise a 
disposition d'au moins une trame d'echantillons dans " FIFO 2 
L'algorithme de concatenation de trames est alors calibre pour generer 
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toujours un minimum d'echantillons, mais au moins une trame. Une autre 
solution peut aussi consister a I'activer plusieurs fois au lieu d'une seule fois 
quand cela est necessaire pour obtenir un nombre d'echantillons suffisant. 

Dans le troisieme niveau d'alarme, normalement jamais atteint, 
5 aucune trame n'est stockee dans « FIFO 2 ». En variante, le systeme peut 
aussi decider d'effectuer une vidange brutale d'une partie de la memoire 
tampon (ceci pourra etre le cas, si c'est la gestion de " FIFO 1 " qui est 
activee). 

On notera egalement que suivant les reseaux et les types de 
10 problemes d'asynchronisme, on peut choisir d'activer ou non certains 
niveaux d'alarme. Par exemple dans le cas « d'asynchronisme faible », les 
niveaux d'alarme 1 et 2 peuvent etre regroupes, et la solution simple de 
remplacement de deux trames par une seule peut alors etre le seul 
traitement actif. 

15 

3. 2 Seuils d'alarme 

On va maintenant decrire de fagon plus detaillee les seuils d'alarme 
et leur gestion. 

Comme cela a ete explique precedemment, la memoire de 
20 reference est declaree en etat d'alarme 1, lorsque son remplissage est 
superieur au seuil 1 ; cet etat reste actif jusqu'a ce que le remplissage 
devienne inferieur au seuil 0. L'etat 1 suit done un fonctionnement sous 
forme d'hystheresis. 

La memoire est declaree en etat d'alarme 2, si le remplissage 
25 devient superieur au seuil 2, et en etat d'alarme 3, si le remplissage est 
superieur au seuil 3. Une gestion de ces etats d'alarme par hystheresis peut 
aussi etre envisagee. 

Les seuils 0, 1 et 2 sont adaptatifs. Le seuil 3 qui est lui directement 
lie a la taille maximale toleree est fixe. L'adaptation de ces seuils est 
30 necessaire pour prendre en charge les differents contextes des 
communications et les fluctuations au cours du temps de celle-ci. En effet, 
il convient de pouvoir neanmoins autoriser plus de retard quand il y a 
beaucoup de gigue dans la communication (la prise de retard au rendu 
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restant le meilleur moyen d'assurer une qualite correcte en presence de 
gigue). Dans un contexte de gigue importante, il convient done d'avoir les 
seuils 0, 1 et 2 a des niveaux assez eleves. 

Pour faciliter le traitement, la position des seuils peut corresponds 
5 a un nombre entier de la taille des trames echangees entre les differentes 
taches du recepteur. Soit Tt cette taille de trames. 

Les valeurs initiates de ces seuils peuvent par exemple etre les 
suivantes : 

Seuil 0 : 5 x Tt 
10 Seuil 1 : 8 xTt 

Seuil 2 : 12 xTt 

Seuil 3 : 24 x Tt (valeur fixe) 

Les seuils 0, 1 et 2 pourront etre adaptes ensemble par pas de taille 
Tt. Les valeurs extremes admises peuvent par exemple etre de -1 a +8. 

15 Ainsi, par exemple, le seuil 1 peut prendre les valeurs 7x, 8x, 9x, 

10x, .... 16x Tt. L'adaptation proprement dite des seuils se fait a partir d'un 
critere d'adaptation qui est le temps passe en etat d'alarme. A cet effet, un 
pourcentage d'etat d'alarme est evalue toutes les N secondes environ (par 
exemple N = 10). Lorsque ce pourcentage est superieur a un seuil donne 

20 (5%) les seuils d'etat d'alarme sont augmentes ; lorsqu'au contraire ces 
pourcentages sont inferieurs a un seuil minimal donne (0,5%), les seuils 
d'alarme sont diminues. Pour eviter une trop grande oscillation du systeme 
due a une adaptation trop frequente des seuils, un hystheresis est applique 
sur la decision d'adaptation. En effet, les seuils ne sont reellement 

25 augmentes d'un pas qu'en presence de deux options d'augmentation 
consecutives et diminuees d'un pas en presence de trois options de 
diminution consecutives. II s'ecoule done au minimum 2*N secondes entre 
deux increments de seuils et 3*N secondes entre deux decrements de 
seuils. La procedure d'augmentation des seuils peut etre acceleree si un 

30 important pourcentage de trames est en alarme. Une procedure 
acceleratrice consiste a incrementer directement les seuils si par exemple le 
pourcentage d'alarme est superieur a 50 %. 
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Bien entendu, les valeurs seuils donnees pour les pourcentages 
d'alarme ne sont fournies qu'a titre indicatif. 

3.3 Interaction avec le premier traitement 

5 

Le premier traitement est le traitement qui declenche la generation 
de « fausses » trames sur perte de trames ou trames erronees. Dans le cas 
ou le systeme est en alarme (surabondance de trames), il devient inutile de 
generer ces « fausses » trames qui ne vont qu'aggraver le phenomene de 

10 surabondance. Toutefois, il est important pour la qualite du rendu 
acoustique de garder une synchronisation codeur - decodeur en informant 
le decodeur de la perte de trame (en lancant par exemple, une ou deux 
generations de fausses trames (mais pas plus)). Le troisieme traitement 
agira en etat d'alarme sur le premier traitement pour limiter fortement la 

15 generation de « fausses » trames. 

3.4 Concatenation de trames 

Le traitement de concatenation a pour but de raccourcir la duree 
20 d'un signal audio numerique contenant de la parole ou de la musique en 
introduisant le moins de degradation audible possible. La frequence 
d'echantillonnage etant donnee et fixee, on diminue le nombre des 
echantillons qui sont envoyes a I'appareil de restitution de son. Une solution 
evidente pour raccourcir une sequence de N echantillons est d'enlever M 
25 echantillons regulierement espaces de la sequence en question. Ceci 
entraTne ('augmentation de la frequence fondamentale qui peut etre genante 
a I'ecoute surtout lorsque le rapport M/N est eleve. De plus, on risque de ne 
plus respecter le theoreme d'echantillonnage. Le traitement presente ci- 
dessous permet de raccourcir une sequence audio sans modifier la 
30 frequence fondamentale et sans introduire une degradation audible due a la 
discontinuite du signal. Ce traitement est base sur une detection de la 
valeur de la periode « pitch ». Le nombre des echantillons elimines par cet 
algorithme ne peut pas etre choisi librement, il est un multiple de ia valeur 
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du pitch P. On peut toutefois definir le nombre minimal des echantillons a 
eliminer N em in qui doit verifier la relation N em in<N/2. Comme, dans le cadre du 
dispositif de gestion de I'asynchronisme d'une transmission audio, le but est 
de supprimer au moins 50% des echantillons. On fixe avantageusement 
5 Nemin- N/2. On suppose egalement que la valeur maximale du pitch P est 
inferieure a la longueur N de la sequence a raccourcir. Le nombre N e des 
echantillons eiimines par I'algorithme est alors le plus petit multiple de la 
valeur du pitch P qui est superieur ou egal a N e min : N e =kP, ou k est un 
entier positif, Ne>Nemtn>Ne-P. La longueur du signal de sortie est alors N r =N- 
10 N e . notons le signal d'entree a raccourcir s(n), n=1,..., N est le signal de 
sortie s'(n), n=1 I ... l N r . Pour assurer la continuity du signal de sortie, on fait 
la fusion progressive des premiers et des derniers N r echantillons du signal 
s(n) : s , (n)=s(N e =n).w(n)+s(n).(1-w(n)), n=1,..., N r 

ou w(n) est une fonction de ponderation telle que 0<w(n)<1 ,n=1,...,N r , et 
15 w(n)<w(n+1),n=1,...,N 1 -1. Par exemple, w(n) peut etre tout simplement la 

fonction lineaire w(n)=n/N r . Pour un signal non voise ou on ne peut pas 

determiner le pitch, N e peut etre fixe librement. 

La figure 4 representant des sequences A, B, C et D de signaux 

illustre la mise en ceuvre du traitement sur un exemple concret. La premiere 
20 sequence (A) montre le morceau de signal s(n) de N=640 echantillons a 

raccourcir en trait plein. Le but est de raccourcir cette sequence par au 

moins 320 echantillons, sans changer la frequence fondamentale, et sans 

introduire une discontinuity ou autres degradations audibles. Le pitch de 

s(n) varie lentement, sa valeur est egale a 49 au debut de la sequence et 45 
25 a la fin de la sequence. Le pitch detecte par une methode de correlation est 

P=47. Ainsi, s(n) sera raccourci par k=7 periodes, soit N e =kP=7*47=329 

echantillons. 

Dans cet exemple on a choisi la ponderation lineaire. Les 
sequences B et C illustrent les deux morceaux de signal de longueur N r =N- 
30 N e =311 deja ponderes qui seront fusionnes dans la suite. La fusion 
s'effectue en additionnant ces deux signaux. Sur la sequence C, on peut 
observer qu'a cause de la legere variation du pitch, ces deux morceaux de 
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signal s(n) sont un peu dephases. Grace a la technique de fusion utilisee, 
ceci n'introduit pas une discontinuity dans le signal de sortie s'(n) (trait plein 
sur la sequence D). On voit egalement sur la sequence 4 que le signal 
raccourci s'(n) reste parfaitement en phase avec les signaux precedant et 
5 suivant (trait en tirets sur les figures 1 et 4). 
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REVENDICATIONS 

1. Procede pour la gestion du decodage et de la restitution d'un 
5 signal sonore, dans un systeme de transmission asynchrone, selon lequel 

on detecte une eventuelle surabondance de remplissage de ladite memoire 
tampon et/ou d'une deuxieme memoire tampon en entree ou en sortie du 
bloc de decodage en comparant le taux de remplissage a au moins un seuil, 
caracterise en ce que, selon la valeur du taux de remplissage, 
10 - on met en ceuvre une detection d'activite vocale et on supprime 

les trames considerees comme non actives par cette detection, 

- on met en oeuvre un traitement de concatenation sur deux trames 
successives. 

2. Procede selon la revendication 1, caracterise en ce qu'on met on 
15 met en oeuvre une detection d'activite vocale et on supprime les trames 

considerees comme non actives par cette detection, lorsque le taux de 
remplissage est compris entre un premier et un deuxieme seuil et en ce 
qu'on met en oeuvre un traitement de concatenation sur deux trames 
successives, lorsque le taux de remplissage est compris entre un deuxieme 
20 et un troisieme seuils. 

3. Procede selon la revendication 2, caracterise en ce que le 
premier et le deuxieme seuils sont confondus. 

4. Procede selon Tune des revendications precedentes, caracterise 
en ce qu'on detecte en entree ou en sortie d'un bloc de decodage 

25 comportant une premiere memoire tampon en entree et/ou en sortie une 
eventuelle trame manquante ou erronee ou une eventuelle absence 
d'echantillons a restituer et on genere une fausse trame qui assure la 
continuity du rendu audio lorsqu'une telle trame manquante ou erronee ou 
une telle absence d'echantillons a restituer est detectee. 

30 5. Procede selon la revendication 4, caracterise en ce que dans le 

cas ou le bloc de decodage met en oeuvre de fa?on cyclique son traitement 
de decodage par rapport au contenu de la premiere memoire tampon, on 
met en oeuvre avec la rneme frequence cyclique la detection d'une 
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eventuelle trame manquante ou erronee ou d'une eventuelle absence 
d'echantillons a restituer, cette detection intervenant suffisamment en 
avance par rapport au traitement de decodage de fagon a permettre une 
generation de fausse trame en temps voulu. 
5 6. Procede selon Tune des revendications 4 et 5, caracterise en ce 

qu'on ne genere pas de fausse trame lorsqu'une detection de trame 
manquante ou erronee intervient sur une trame pour laquelle une absence 
d'echantillons a deja ete detectee. 

7. Procede selon Tune des revendications 4 a 6, caracterise en ce 
10 que dans le cas ou le systeme est d'un type qui peut arreter volontairement 

d'emettre des trames, on memorise d'une trame a I'autre le type de trame 
precedemment generee et on determine en fonction de cette information s'il 
faut generer des fausses trames ou des trames de silence. 

8. Procede selon Tune des revendications precedentes, caracterise 
15 en ce que dans un traitement de concatenation de deux trames successives 

on pondere les echantillons de fagon a donner plus d'importance aux 
premiers echantillons de la premiere trame et aux derniers echantillons de 
la deuxieme. 

9. Procede selon Tune des revendications precedentes, caracterise 
20 en ce que le (ou les) seuil(s) est (ou sont) adaptatif(s). 

10. Procede selon la revendication 9, caracterise en ce que 
I'adaptation d'un seuil est fonction du temps passe avec un taux de 
remplissage superieur a un seuil donne. 

11. Dispositif de restitution d'un signal de parole comportant une 
25 premiere memoire tampon recevant des trames codees, des moyens 

mettant en oeuvre un traitement de decodage sur les trames memorisees 
dans ladite premiere memoire tampon, une deuxieme memoire tampon 
recevant des trames decodees en sortie des moyens de decodage, des 
moyens de restitution sonore recevant les trames en sortie de la deuxieme 
30 memoire tampon, caracterise en ce qu'il comporte en outre des moyens 
pour mettre en oeuvre le procede selon Tune des revendications 
precedentes. 
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PROCEDE POUR LA GESTION DU DECODAGE ET DE LA 
RESTITUTION D'UN SIGNAL SONORE DANS UN SYSTEME DE 
TRANSMISSION ASYNCHRONE 

5 La presente invention est relative a un procede de gestion de 

I'asynchronisme d'une transmission audio. 

PRESENTATION GENERALE DU DOMA1NE DE ^INVENTION 

10 De fagon generate, invention se rapporte aux systemes de 

transmission utilisant des codeurs de parole a debit reduit, dans lesquels les 
signaux ne transported pas I'horloge de reference du systeme de codage 
de la source (frequence d'echantillonnage du codeur). Ceci est le cas par 
exemple pour les transmissions de type IP (protocole internet) ou encore 

15 pour les transmissions discontinues, etc. 

Un but general de I'invention est de resoudre les problemes de 
production de flux continu de parole ou de son decodes rencontres avec de 
tels systemes. 

Traditionneilement les reseaux de communications telephoniques et 
20 de voies sons ont utilise des systemes de transmission analogiques et de 
multiplexage par repartition en frequence (groupe primaire, modulation 
d'amplitude et de frequence). Dans ces conditions, le signal de parole (ou 
de musique ; le terme parole sera utilise de maniere generique dans la suite 
de ce document) est converti en signal electrique par un microphone et c'est 
25 ce signal analogique qui est filtre et module pour etre presente au recepteur 
qui I'amplifiera avant de le presenter au systeme de restitution (ecouteur, 
haut-parleur, etc.). 

Depuis un certain nombre d'annees, les techniques de transmission 
et de commutation numerique ont peu a peu remplace les techniques 
30 analogiques. Dans ces systemes appeles MIC (modulation par impulsion 
ou PCM en anglais pour Pulse Code Modulation), le signal de parole est 
echantillonne et converti en numerique a I'aide d'un convertisseur 
numerique analogique (CNA dans la suite) pilote par une frequence 
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d'echantillonnage fixe derivee d'une horloge maitresse delivree par le 
reseau et connue egalement du systeme de reception. C'est le cas pour les 
URA et URN (Unite de raccordement d'abonne analogique et numerique) du 
reseau de telecommunications. Le signal numerique regu par le destinataire 
5 (au sens large) est converti en analogique afin de pouvoir etre ecoute a 
Taide d'un convertisseur numerique analogique (CNA dans la suite) pilote 
par une horloge de meme frequence que celle utilisee par le CAN de la 
source. Dans ces conditions, le systeme complet est parfaitement 
synchrone et c'est le cas generalement des systemes actuels de 

10 commutation et de transmission. Ceux ci peuvent inclure des systemes de 
reduction de debit (par exemple pour le signal telephonique, passer de 64 
kbit/s a 32, 16 ou 8 kbit/s). C'est le reseau (ou les systemes terminaux 
comme par exemple dans le cas du RNIS (ISDN en anglais)) qui se charge 
des operations de CAN, de codage, de decodage (codage et decodage pris 

15 ici dans le sens reduction de debit) et de CNA. Les horloges sont toujours 
distributes et la chalne CAN, codeur de parole, transmission et 
commutation, decodeur de parole et finalement CNA est parfaitement 
isochrone. II n'y a pas de pertes ou de repetitions d'echantillons de parole 
dans le decodeur. 

20 Les techniques de transmissions synchrones decrites 

precedemment necessitent la presence d'une horloge de reference dans 
tout le reseau. De plus en plus, les techniques de transmission (de 
donnees dans un premier temps) font appel a des techniques asynchrones 
et par paquets (protocole IP, ATM). Dans de nombreuses nouvelles 

25 situations, le decodeur n'a plus aucune reference concernant la frequence 
d'echantillonnage utilisee par le codeur et doit reconstituer par ses propres 
moyens une horloge de decodage qui essaye de suivre la reference au 
codeur. La presente invention est done particulierement interessante pour 
les systemes de telephonie sur relais de trame ("FRAME RELAY" selon la 

30 terminologie anglo-saxonne), pour la telephonie sur ATM ou pour la 
telephonie sur IP. La technique presentee peut etre facilement utilisee dans 
d'autres domaines de transmission de la parole ou des sons pour lesquels il 
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n r y a pas de transmission effective de la reference d'horloge du codeur vers 
le decodeur. 

PRESENTATION DE L'ETAT DE LA TECHNIQUE 



Le probleme general pose par les systemes de transmission 
auxquels s'appliquent I'inventiori est de pallier le fait que le decodeur de 
10 parole ou de son ne possede pas de reference d'horloge liee au codage de 
la source. 

On peut a cet egard distinguer deux cas : ceux correspondant a un 
« asynchronisme faible » et ceux correspondant a un « asynchronisme 
fort ». 



« L'asynchronisme faible » 

A titre illustratif, on se place dans le cas d'un systeme de 
transmission qui comporte, ainsi qu'illustre schematiquement sur la figure 



- une source de codage 1 comprenant un convertisseur analogique 
numerique pilote par une horloge de reference de frequence Fcan egale a 8 
kHz (pour fixer les elements de calcul dans la suite de la presentation) et un 
codeur de parole (plus ou moins complexe et reduisant de maniere plus ou 

25 moins importante le debit a transmettre) ; 

- un systeme de transmission asynchrone (schematise par la liaison 
2) qui transmet les informations produites par la source de codage en 
utilisant sa propre horloge de transmission et ses propres protocoles (par 
exemple, on peut imaginer que le codeur de parole produit un debit de 8 

30 kbit/s et que le systeme de transmission est constitue par une liaison de 
type asynchrone RS.232 a 9600 bit/s) ; 

- un systeme de reception et de decodage 3 recevant les 
informations transmises par la liaison asynchrone (dont le debit doit etre 




15 



20 1 : 
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evidemment un peu plus eleve que le debit brut de codage, par exemple 
9600 bit/s au lieu de 8000 bit/s) et charge de produire le signal apres un 
decodage (decompression) et en envoyant le signal produit vers un 
convertisseur numerique analogique connecte a un transducteur de type 
5 haut-parleur, combine telephonique, casques ou carte son installee dans un 

PC. K-,,- . ... v , 1 

On comprend que puisque le systeme de reception et de decodage 
3 ne dispose d'aucune reference d'horloge, il doit mettre en oeuvre une 
strategie afin de pallier ce manque de synchronisation entre le codeur et le 
10 decodeur. 

Quelque soit la technique de codage utilisee ou le type de 
transmission qui ne transporte pas directement une horloge, des marqueurs 
temporels dans la trame transmise ou des indications sur les instants de 
transmission, on peut ramener le probleme evoque precedemment (en 
15 faisant abstraction du codeur de parole, du systeme de transmission 
asynchrone et du decodeur de parole) a un systeme comprenant, ainsi 
qu'illustre sur la figure 2 : 

- un convertisseur analogique numerique 4 charge de convertir 
d'analogique en numerique des sons ou des signaux de parole a une 

20 frequence d'echantillonnage fixee par un oscillateur local ; 

- un convertisseur numerique analogique 5 charge de reproduire les 
sons vers un transducteur approprie au domaine d'utilisation concerne et 
qui fonctionne sur une frequence d'echantillonnage donne par un oscillateur 
local a priori de meme frequence mais qui n r est jamais exactement a la 

25 meme frequence pour des couts de realisation tolerable (il existe des 
sources de frequence tres stables et tres precises mais elles doivent etre 
cornpensees en temperature et leur cout est redhibitoire pour des 
realisations industrielles de grand volume) ; 

- un registre numerique 6 dans lequel le convertisseur analogique 4 
30 ecrit avec sa frequence d'echantillonnage (F C an), ce registre etant lu avec la 

frequence d'echantillonnage (F C na) du systeme de reproduction par le 
convertisseur numerique analogique (le CNA). 
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On comprend que puisque les deux horloges (de frequences F C an 
et Fcna) sont differentes, de temps en temps le CNA va relire deux fois la 
meme information (si Fcna est superieure a Fcan) ou dans le cas contraire 
(Fcna est inferieure a Fcan) une information va etre ecrasee par le CAN 
5 avant que le CNA ne puisse la relire. 

Les oscillateurs que Ton trouve couramment dans le commerce sont 
caracterises par une precision de fonctionnement (dans une certaine 
gamme de temperature). 

Les oscillateurs a 50 ppm (partie par million) sont assez courants et 

10 servent de base au calcul suivant qui indiquera la frequence des pertes ou 
des repetitions d'echantillons pour une frequence d'echantillonnage de 8 
kHz (le lecteur pourra aisement calculer que pour des frequences 
d'echantillonnage plus elevees la frequence des sauts et des repetitions 
s'obtient dans le rapport des frequences d'echantillonnage ; plus la 

15 frequence d'echantillonnage est elevee et plus la frequence des sauts ou 
des repetitions sera elevee). 

Dans les conditions les moins favorables, on dispose d T un CAN 
fonctionnant a 8000*(1 + 50.e-6) et d'un CNA fonctionnant a 8000*(l -50.e- 
6). Dans cet exemple particulier, la periode des sauts (suppression 

20 d'echantillons dans le CNA puisque Fcna est inferieure a Fcan) est 
simplement calculee en comptant le nombre de periode du CNA (periode 
superieure a celle du CAN) qui produit une valeur egale a cette periode du 
CNA quand elle est multipliee par la difference des periodes. 

Soit Pcna la periode du CNA (ici 1/8000*(l - 50.e-6)) et Pcan la 

25 periode du CAN (ici 1/8000*(l + 50.e-6)) ; on doit done avoir N*(Pcna-Pcan) 
= Pcna. N represente le nombre d'operations elementaires qui se decalent 
de la difference de periodes. En posant 50e-6 = e et en appliquant les 
regies de simplification courantes pour les petits nombres, on obtient N = 
l/(2*e). Dans notre exemple cela donne immediatement la periode des 

30 sauts qui sera proche de 1.25 secondes. Si la precision des oscillateurs 
locaux est amelioree (par exemple en passant de 50.e-6 a 5.e-6) alors la 
periode des sauts augmentera (ici ce sera toutes les 12.5 secondes). 
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Ce phenomene de " glissement " d'une horloge par rapport a une 
autre va entraTner lorsque Ton se place dans un systeme complet de 
transmission avec des codeurs audio fonctionnant sur des trames de signal, 
des absences de trames de parole (aucune trame a decoder dans le temps 
5 imparti pour le decodage) ou une sur abondance de trames (deux trames a 
decoder au lieu d'une dans le temps imparti). En effet, en prenant I'exemple 
d'un codeur de parole fonctionnant avec des trames de 30 ms a 8 kHz, soit 
240 echantillons, au niveau du recepteur et plus particulier du decodeur on 
s'attend a recevoir dans un creneau temporel{ de; 30ms, une trame a 

10 decoder, afin d'assurer la continuity du rendu de signal de parole. Or, si par 
exemple, Fcan est inferieur a Fcna, nous allons avoir, en prenant les 
hypotheses precedentes, une absence de trame d'echantillons a decoder 
par le systeme de restitution sonore toutes les 240 * 1,25 = 300 secondes, 
et a I'inverse deux trames au lieu d'une (soit une trame a « supprimer ») a 

15 decoder toutes les 300 secondes. Dans ce cas, le phenomene genant du 
saut ou de la repetition d'echantillons devient vraiment fort desagreable 
puisque c'est tout un bloc de signal qui est saute ou repete et necessite 
done une gestion adequate. 

20 « L'asynchronisme fort » 

Certains types de transmissions amplifient ce probleme 
d'asynchronisme du au phenomene de « glissement » des horloges 
explicite precedemment. C'est ce qu'on entend ici par « asynchronisme 
25 fort ». 

En effet, lorsque la transmission n'est pas parfaite et introduit des 
pertes d'echantillons ou de trames d'echantillons et aussi lorsque la 
transmission genere une gigue sur ('arrive des echantillons, non liees a 
I'horloge d'emission ou a I'horloge de reception, mais liee a d'autres 
30 mecanismes de la chalne de transmission possedant leur propre horloge, le 
systeme de reception peut alors etre confronts a I'absence de plusieurs 
trames, ou a la surabondance de plusieurs trames. Ceci est par exemple le 
cas pour des reseaux de type IP avec le phenomene de pertes de paquets 



This Page Blank (uspto) 



WO 01/01727 



PCT/FRO0/01734 



7 

et celui de la gigue introduite lors du routage des paquets. Ces 
phenomenes vont fortement perturber la continuite du rendu acoustique du 
signal audio. En effet, dans le cas de pertes de paquets ou d'une gigue 
ayant retardee un ou plusieurs paquets, le systeme de rendu va se trouver 
5 sans aucun echantillon (ou aucune trame d'echantillons) a envoyer au CNA 
pour assurer la continuite du rendu acoustique. Et inversement, dans le cas 
d'une forte gigue, le systeme de restitutions peut se retrouver avec 
beaucoup trop de trames ou d'echantillons a envoyer en meme temps au 
CNA. En effet, en presence d'une forte gigue, la transmission des trames 
10 de signal sonores peut s'effectuer sous forme de rafales, creant ainsi de 
forts phenomenes de trous et de sur abondance de trames d'echantillons. 

On notera que lors de I'utilisation de codeurs de parole fonctionnant 
avec un systeme de transmission de type VAD/DTX/CNG (Voice Activity 
Detector/Discontinous Transmission/Comfort Noise Generation selon la 
15 terminologie anglo-saxonne), on introduit aussi un mecanisme qui est 
similaire au cas de la perte de paquet, puisqu'en cas de silence, I'emetteur 
cessera d'emettre des trames d'echantillons. L'arret d'emission 
d'echantillons peut en effet au niveau du recepteur etre assimile au 
phenomene de la perte de paquet ou encore au cas ou I'horloge du CAN est 
20 plus rapide que celle du CNA, ce qui amene comme cela a ete montre ci- 
dessus des trous dans le signal au niveau du recepteur. 

" L'asynchronisme fort " se distingue done de " I'asynchronisme 
faible " en impliquant non plus uniquement des sauts et7ou repetitions de 
manieres cycliques, mais aussi des trous dans le signal et/ou de la 
25 surabondance de signal et ceci de maniere non cyclique et multiple. 

Description des differentes methodes existantes. 

On connaTt principalement deux methodes pour pallier les 
30 inconvenients dus au fait que le decodeur de parole ou de son ne possede 
pas de reference d'horloges. 

La premiere consiste simplement a proceder comme cela a ete 
enonce dans les paragraphes decrivant " Tasynchronisme faible e'est a 
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dire en sautant ou en repetant des echantillons. Le systeme de decodage 
produit des echantillons a un rythme a peu pres egal a celui du codeur et 
les presente au convertisseur numerique analogique avec ce rythme (les 
moyens de realisation de ce systeme de reconstruction sont connus de 
5 I'homme de Tart). Dans certains cas, par exemple dans le cas 
"d'asynchronisme fort" avec transmission sous forme de trames, il est 
prefere en I'absence d'echantillons a jouer, renvoi de trames d'echantillons 
nulles au CAN, plutot que la repetition de la trame precedente. De plus, a 
Tinverse lors d'un surplus d'echantillons, ceux-ci ne seront pas supprimes 

10 directement, mais une FIFO d'une certaine taille pourra etre utilisee pour 
absorber en partie la gigue. Un remplissage trop important de cette FIFO 
declenchera une vidange partielle ou complete de cette FIFO creant ainsi a 
nouveau des sauts dans le rendu sonore. 

La deuxieme methode, plus eiaboree et plus performante, necessite 

15 la mise oeuvre de boucle de recuperation d'horloge materielle asservie par 
I'etat de remplissage d'une memoire tampon du signal a decoder (ou a 
transmettre comme par exemple dans les AAL1 de I'ATM). Cette methode 
d'asservissement tente grace a la boucle de recuperation d'horloge de 
recuperer la frequence d'echantillonnage de la source. L'etat de 

20 remplissage du buffer de reception produit un signal de commande afin 
d'asservir une boucle PLL (numerique ou analogique). 

La premiere methode presente une extreme simplicity de realisation 
mais a un gros defaut lie a la qualite des sons reproduits. En effet, un saut 
ou une suppression toutes les 1.25 secondes peut etre tres desagreable a 

25 I'ecoute, cas de " I'asynchronisme faible avec correction de 
Tasynchronisme au niveau de Techantillon. De meme, dans le cas d'un 
systeme fonctionnant avec des trames d'echantillons, les repetitions ou les 
blancs introduits, ainsi que les discontinues dans le signal par suppression 
de trames amplifient la degradation de qualite rendue fortement perceptible 

30 et fortement perturbante pour I'auditeur. 

De plus, avec ('utilisation d'une memoire premier entrant/premier 
sortant (FIFO), Ton risque de prendre un retard consequent dans la 
transmission, ce qui nuit aussi a la qualite globale de la communication. 
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La deuxieme methode est, el!e, beaucoup plus complexe et 
demande un mecanisme d'asservissement d'horloge et done un materiel 
specifique. Par contre, elle assure un synchronisme partiel et evite done les 
problemes de gestion d'asynchronisme. Neanmoins, cette methode 

5 s'adapte mal a des systemes de transmission discontinue, a des systemes 
avec pertes de frameset aussi a des systemes avec forte gigue. Dans ces 
cas, ('information de synchronisation n'est plus disponible. De plus, cette 
methode n'est pas envisageable sur des plates-formes de terminaux ou 
I'asservissement de I'horloge n'est pas possible, comme e'est notamment le 

0 cas avec des terminaux de type PC par exemple ou le systeme de rendu 
acoustique utilise serait la carte son. 

PRESENTATION DE ^INVENTION 

5 Un but general de Pinvention est de proposer une solution aux 

problemes de continuity du rendu du signal de parole en presence d'une 
transmission asynchrone, et ceci en agissant au niveau du recepteur, e'est 
a dire a la fin de la chalne de transmission. 

A cet effet, 1'invention propose un procede pour la gestion du 
decodage et de la restitution d'un signal sonore, dans un systeme de 
transmission asynchrone, selon lequel on detecte une eventuelle 
surabondance de remplissage de ladite memoire tampon et/ou d'une 
deuxieme memoire tampon en entree ou en sortie du bloc de decodage en 
comparant le taux de remplissage a au moins un seuil, caracterise en ce 
que, selon la valeur du taux de remplissage, 

- on met en ceuvre une detection d'activite vocale et on supprime 
les trames considerees comme non actives par cette detection, 

- on met en oeuvre un traitement de concatenation sur deux trames 
successives. 

Un tel procede est simple a mettre en oeuvre et assure une garantie 
de qualite en evitant d'accroTtre excessivement le retard de transmission et 
en gerant efficacement les trous dans le signal de parole. De plus, il 
n'implique aucun circuit d'asservissement hardware specifique, et peut done 
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s'adapter raptdement a des plates-formes, terminaux et reseaux 
asynchrones differents. 

Ce procede est avantageusement complete par les differentes 
caracteristiques suivantes prises seules ou selon toutes leurs combinaisons 
5 techniquement possibles : 

- on met on met en oeuvre une detection d'activite vocale et on supprime les 
trames considerees comme non actives par cette detection, lorsque le taux 
de remplissage est compris ""entire tin premier et tin deuxieme seuil et en ce 
qu'on met en oeuvre un traitement de concatenation sur deux trames 

10 successives, lorsque le taux de remplissage est compris entre un deuxieme 
et un troisieme seuils ; 

- le premier et le deuxieme seuils sont confondus ; 

- on detecte en entree ou en sortie d'un bloc de decodage comportant une 
premiere memoire tampon en entree et/ou en sortie une eventuelle trame 

15 manquante ou erronee ou une eventuelle absence d'echantillons a restituer 
et on genere une fausse trame qui assure la continuity du rendu audio 
lorsqu'une telle trame manquante ou erronee ou une telle absence 
d'echantillons a restituer est detectee ; 

- dans le cas ou le bloc de decodage met en oeuvre de fagon cyclique son 
20 traitement de decodage par rapport au contenu de la premiere memoire 

tampon, on met en oeuvre avec la meme frequence cyclique la detection 
d'une eventuelle trame manquante ou erronee ou d'une eventuelle absence 
d'echantillons a restituer, cette detection intervenant suffisamment en 
avance par rapport au traitement de decodage de fagon a permettre une 
25 generation de fausse trame en temps voulu ; 

- on ne genere pas de fausse trame lorsqu'une detection de trame 
manquante ou erronee intervient sur une trame pour laquelle une absence 
d'echantillons a deja ete detectee ; 

- dans le cas ou le systeme est d'un type qui peut arreter volontairement 
30 d'emettre des trames, on memorise d'une trame a I'autre le type de trame 

precedemment generee et on determine en fonction de cette information s'il 
faut generer des fausses trames ou des trames de silence ; 
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- dans un traitement de concatenation de deux trames successives on 
pondere les echantillons de fagon a donner plus d'importance aux premiers 
echantillons de la premiere trame et aux derniers echantillons de la 
deuxieme ; 

5 - le (ou les) seuil(s) est (ou sont) adaptatif(s) ; 

- un seuil est fonction du temps passe avec un taux de remplissage 
superieur a un seuil donne. 

L'invention concerne egalement un ; tlispositif de restitution d'un 
signal de parole comportant une premiere memoire tampon recevant des 
0 trames codees, des moyens mettant en ceuvre un traitement de decodage 
sur les trames memorisees dans ladite premiere memoire tampon, une 
deuxieme memoire tampon recevant des trames decodees en sortie des 
moyens de decodage, des moyens de restitution sonore recevant les 
trames en sortie de la deuxieme memoire tampon, caracterise en ce qu'il 
comporte en outre des moyens pour mettre en oeuvre le procede precite. 

Comme on le comprendra a la lecture de la description qui suit, ces 
moyens sont essentiellement des moyens informatiques. 

PRESENTATION DES FIGURES 

D'autres caracteristiques et avantages de 1'invention ressortiront 
encore de la description qui suit qui est purement illustrative et non limitative 
et qui doit etre lue en regard des dessins annexes sur lesquels : 

- la figure 1 est une representation schematique d'une chaine de 
transmission asynchrone ; 

-Ja figure 2 est un schema illustrant une moderation d'une telle 
chaine de transmission ; 

- la figure 3 est un schema d'un dispositif de reception ; 

- la figure 4 illustre des signaux obtenus en mettant en ceuvre un 
traitement de concatenation propose par ['invention. 
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DESCRIPTION DETA1LLEE D'UN OU PLUSIEURS MODES DE 
REALISATION 

Le procede de gestion de I'asynchronisme de la transmission 
propose par I'invention met en ceuvre deux traitements correspondant a la 
prise en charge des deux phenomenes precedemment exposes qui sont 
I'absence d'echantillons et le surplus d'echantillons. 

1. Presentation de la chaine de rendu sonore d'une 
application classique de transmission. 

Ainsi que cela a ete illustre sur la figure 3, la chaTne de rendu du 
signal de parole se decompose en trois elements : 

- Un bloc 10 d'attente de reception d'echantillons ou de trames de 
codes provenant du reseau. Ce bloc 10 contient une memoire 1 1 de type 
FIFO ou memoire tampon de type circulaire (que Ton appellera " FIFO 1 " 
dans la suite du document) permettant de stocker temporairement les 
trames avant leur decodage. 

- Un bloc 12 de decodage qui prend les trames issues du bloc 10, 
les decode, et les stocke a son tour dans une memoire FIFO 13 (que Ton 
appellera " FIFO 2 " dans la suite du document). 

- Un bloc de rendu 14 qui va prendre les trames d'echantillons 
decodes, et les envoyer au systeme de rendu sonore 15 quel qu'il soit. 

Suivant les terminaux et ('organisation de cette chaine, la frequence 
de I'horloge de rendu sonore (celle du convertisseur numerique analogique 
Fcna) n'est pas forcement directement liee a tous ces blocs. Le bloc 14 
etant en liaison directe avec le systeme rendu, celui-ci est directement lie a 
la frequence Fcna. Les autres blocs peuvent etre en connexion plutot avec 
la cadence d'arrivee des trames en provenance du reseau qu'avec cette 
frequence Fcna. En effet, en prenant I'exemple d'un terminal pourvu d'un 
systeme multitaches, et ou chaque bloc serait effectue par une tache 
specifique, les taches 10 et 12 pourraient etre liees done a la reception de 
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trames. La tache 10 attend une trame du reseau, celle-ci est ensuite 
decodee par la tache 12 et placee dans la memoire " FIFO 2 *\ 

Quant a la tache 14 cadencee par Fcna, elle va envoyer en allant 
puiser dans la memoire " FIFO 2 " des echantillons en continu au systeme 
de rendu sonore. 

On voit done qu'ep cas d'asynchronisme^^rl ou faible", e'est la 
gestion de la memoire " FIFO 2 " qui va derhander un soin particulier. De 
meme, si la tache 12 avait ete liee fortement a la tache 14, cette fois cela 
aurait ete la memoire "FIFO 1 " qui aurait demande une attention 
particuliere. 

Le mecanisme conforme a un mode de mise en ceuvre de 
I'invention va etre presente en appliquant la gestion sur la memoire " FIFO 
2", mais Ton verra au cours des explications comment le transposer 
moyennant certaines adaptations, a la gestion de la memoire " FIFO 1". 

2. Absence d'echantillons 

Pour assurer un rendu sonore continu en cas d'absence 
d'echantillons, on traite en parallele les deux sources potentielles d'absence 
d'echantillons a restituer. La premiere correspond a Tinformation de pertes 
de paquets, et la seconde correspond a Tinformation d'absence 
d'echantillons a restituer (par exemple « FIFO 2 » vide), alors qu'il est 
necessaire d'envoyer des echantillons au systeme de rendu sonore. 

2.1 Perte de trames, ou trames erronees 

Le traitement sur les pertes de trames ou les trames erronees 
necessite de disposer d*un systeme de transmission donnant acces a 
information sur la perte de trames ou la reception de trames erronees. 
Ceci est souvent le cas, dans les systemes de transmission. 

Par exemple, pour des reseaux IP, il est possible d'utiliser le 
marquage des paquets de donnees issu de la couche RTP, qui donne le 
nombre exact d'echantillons perdus entre deux receptions de paquets de 
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codes audio. Cette information de pertes de trames ou dans le cas IP de 
perte de paquets (contenant une ou plusieurs trame de parole), ne sera 
generalement connue qu'a la reception du paquet suivant le ou les paquets 
perdus. 

II n'y a pas necessairement un interet a agir, alors qu'une ou 
plusieurs trames valides peuvent etre decodees. En fait, avec les codeurs 
de parole de nouvelle generation (codeurs CELP, codeurs par transformee, 
... ) dans un souci d'ass^prjUnM rendu acoustique, il 

est souvent necessaire d'assurer un certain synchronisme entre le codeur et 
le decodeur. La perte de ce synchronisme codeur-decodeur peut etre 
compensee en utilisant des aigorithmes de correction de pertes de trames 
liees au codeur de parole utilise. Ces aigorithmes sont par exemple prevus 
dans la norme de certains codeurs de parole (ex: norme ITU G.723. 1). 
Avec I'utilisation de codeurs plus simples, ce mecanisme n'est pas 
forcement necessaire. 

Lorsqu'un grand nombre de trames a ete perdu, on peut limiter le 
nombre de " fausses " trames d'echantillons a generer pour eviter de remplir 
inutilement la memoire " FIFO 2 Le but du traitement de generation de 
fausses trames est de remplir les trous de maniere a assurer une continuity 
du signal, mais aussi a lisser les variables internes du decodeur pour eviter 
de trop grandes divergences lors du decodage de la trame valide suivant 
les trames invalides ou perdues, et ainsi eviter une discontinuity audible. 
Apres la generation de quelques trames Ton peut considerer les variables 
comme lissees, et done limiter cette generation de fausses trames a un petit 
nombre de trames (par exemple 4 a 6), lorsqu'un grand nombre de trames 
ont ete perdues. 

Comme on I'aura compris, on asservit ainsi le traitement par rapport 
a Information de pertes de trames. 

Un traitement similaire est mis en oeuvre par rapport a Tinformation 
de trames dites 1 ' trames non valides Cette information est transmise au 
decodeur par la partie reseau du recepteur et ce suffisamment tot pour 
permettre la mise en oeuvre d'un algorithme de corrections de trames qui en 
prenant en compte cette trame non valide permet d'assurer une continuity 
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du signal, ainsi que d'eviter une autre source d'absence d'echantillon dans 
la memoire " FIFO 2 

En resume, ce premier traitement correspond done a la gestion 
d'une information du type " n trames perdues" ou " trame regue non valide " 
5 venu de la couche reseau du recepteur. Cette gestion se caracterise par la 
mise en oeuvre d'un algorithme de correction de pertes de trames (aussi 
appele dans ce document algorithme de generation de "fausses" trames). 
Ce premier traitepe^t^agijs dohg ^b; r^ixlau'de^la itache de decodage et 
alimente la memoire " FIFO 2 

2 . 2 Absence d'echantillons a restituer 

Ce deuxieme traitement est lie a I'horloge issue de la tache 14, e'est 
a dire a I'horloge de frequence Fcna. En effet, comme indique 
precedemment, la memoire « FIFO 2 » (ou « FIFO 1 » si la tache 12 est 
imbriquee a la tache 14 peut ne plus contenir d'echantillons alors qu'il est 
necessaire de fournir des echantillons au systeme de restitutions sonores. 
II convient done de fournir des echantillons a ce systeme de restitution, et si 
possible eviter de restituer des zeros (ceci degradant fortement le signal 
sonore). 

Ce deuxieme traitement peut s'analyser comme une boucle de 
retroaction sur le decodage des trames. Cette boucle declenche Tappel a 
('algorithme de corrections de pertes de trames et doit de ce fait etre activee 
suffisamment tot pour permettre ('execution de I'algorithme et renvoi des 
echantillons au systeme de restitutions sonores. Suivant la plate-forme, 
Tappel a cette retroaction pourra etre different. 

Cette boucle peut etre mise en oeuvre des deux manieres qui vont 
maintenant etre decrites. 

Dans le cas d'un recepteur mono-tache (par exemple sur un DSP 
sans RTOS (Real Time Operating System selon la terminologie 
anglosaxonne), la partie decodeur audio est completement liee a I'horloge 
du CNA (Fcna), et est done en permanence en attente d'une trame a 
decoder de maniere cyclique. Par exemple, avec un codeur de parole 
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utilisant des trames de 30 ms, on construit des boucles d'attentes de 
periode multiple de 30 ms. 

Ainsi, dans le cas d'une boucfe de 30 ms, le decodeur va, toutes les 
30 ms, etre en attente d'une trame a decoder placee dans la memoire 
5 "FIFO 1" (ce qui peut juste correspondre au passage d'une trame de la 
couche reseau a la tache 12. A Tarrivee de celle-ci, il la decode et la place 
dans la memoire " FIFO 2 " pour renvoi au CNA. Le traitement de 
retroaction sera mis en oeuvre par constatation a T=TO+30 ms - Tc de 
I'absence de trame a decoder dans la memoire " FIFO 1", 
10 ou TO = temps du debut de la boucle d'attente de 30 ms, 

et Tc = temps d'execution de I'algorithme de generation de fausses trames 
avec une marge supplemental correspondant aux interruptions et/ou aux 
autres traitements annexes pouvant avoir lieu avant la fin de la boucle. 

Le traitement est done mis en oeuvre avec la butee temporelle 
15 d'attente Tb (temps de boucle) - Tc (temps de calcul + marge). 

Dans le cas d'un recepteur multitache (cas d'un terminal PC par 
exemple), le temps n'est pas gere de maniere aussi precise et done un 
traitement un peu different doit alors etre mis en oeuvre. (Remarque : ce 
traitement reste assez proche du precedent, car il cherche aussi a prendre 
20 en compte le temps Tc). 

Dans un tel cas, on ne dispose souvent que de boucles d'attente 
liees a des evenements, par exemple le fait que des paquets aient ete regus 
par le reseau, ou encore le fait que la memoire tampon " n " (contenant une 
ou plusieurs frames d'echantillons) envoyee precedemment au systeme de 
25 restitution sonore a ete lue par le CNA, et est done a nouveau disponible 
pour nouvel envoi au CNA. 

Suivant I'implantation et la necessite de repondre rapidement ou non 
a I'evenement, il est possible de marquer une temporisation avant le 
remplissage de cette memoire tampon pour re-emission vers le CNA. Cette 
30 temporisation est choisie de fagon a laisser suffisamment de temps pour 
Texecution de Talgorithme de generation de " fausses " trames (si besoin). 

Puis, a Tissue le cas echeant de cette temporisation, le traitement 
verifie la presence de suffisamment d'echantillons dans " FIFO 2 " 
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(remarque : cela peut etre dans " FIFO 1 " si la gestion est placee a ce 
niveau), et dans le cas contraire demande la generation du nombre de 
fausses trames adequat pour remplir la memoire tampon " n 

Dans le cas ou le systeme est tel qu'il faut remplir "immediatemenr 
5 la memoire tampon "n'\ le controle de la disponibilite d'echantillons et I'appel 

eventuel au traitement :, de generation ,de !V.fausse§ ; .trames " sont mis en 

^ ... 

oeuvre directement apres chaque envoi de la memoire tampon au CNA, afin 
que les echantillons generes soient deja dans la memoire " FIFO 2 M lors de 
I'evenement " memoire tampon " n " disponible". 

10 Ainsi, quel que soit le recepteur, le traitement constate I'absence 

d'echantillons a envoyer au systeme de restitutions sonores en mettant en 
oeuvre un controle du remplissage de la memoire tampon "FIFO 2" (ou 
"FIFO 1 " suivant la gestion de la chaine de rendu sonore) et active 
Talgorithme de generation de " fausses " trames pour generer les 

15 echantillons manquants. 

Comme on I'aura compris, le deuxieme traitement repond d'abord 
au probleme de " glissement " des horloges, et plus precisement au cas ou 
Thorloge de reception (Fcna) est plus rapide que Thorloge d'emission 
(Fcan). II intervient aussi vis-a-vis du phenomene de pertes de trames, car 

20 celui-ci peut amener une absence d'echantillons a envoyer au CNA avant 
que ne soit detectee la perte de trames, cette detection n'intervenant qu'a la 
reception de la trame suivant la perte. 

Pour lier les actions du premier et du deuxieme traitement, on 
interdit au premier traitement de generer des " fausses " trames lors d'une 

25 detection de pertes de trames, si les trames correspondantes viennent 
d'etre generees par le deuxieme traitement . 

On utilise a cet effet des drapeaux, ainsi que des compteurs 
determinant le nombre d'echantillons generes par le deuxieme traitement. 



30 
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2. 3. Actions specifiques dans le cas de codeurs de parole utilisant la 
fonctionnalite VAD/DTX/CNG. 

Des codeurs utilisant un systeme VAD/DTX/CNG peuvent arreter 
5 volontairement d'emettre des trames ; dans ce cas, I'absence d'echantillons 
ne doit pas etre consideree exactement comme une perte de trames, mais 
comme un moment de silence. Le seul rrio^en de determiner si la trame a 
generer doit etre du silence ou correspond a une trame perdue, est de 
connaitre le type de la trame precedemment generee (soit trame de signal 

10 ou trame correspondante a une trame perdue (FSF), soit trame de mise a 
jour du bruit (SID), soit trame de silence (NOT)) A cet effet, on memorise le 
type de trame generee, et on determine lors de la generation de trames 
pour absence de trame ou perte de trame, s'il faut generer des fausses 
trames issues de Talgorithme de corrections de pertes de trames, (cas de la 

15 trame precedente de type FSF), ou des trames de silence en activant le 
decodeurde maniere adequate (cas de la trame precedente SID ou NOT). 

3. Surabondance d'echantillons a restituer, 

20 Pour traiter le cas de surabondance d'echantillons a restituer, on 

met en oeuvre un traitement de vidange des trames, avec suppression 
partielle ou complete de certaines trames avant leur eventuelle prise en 
compte par le systeme de rendu sonore. 

Ce traitement permet une memorisation des trames dans les 

25 memoires tampons jusqu'a certains seuils declenchant des actions pour 
limiter cette memorisation et la prise de retard sur la chaine de 
communication qu'elle implique. Cette memorisation iimitee permet en effet 
de tenir compte des phenomenes de gigues de reception de trame en rafale 
et de glissement d'horloge tout en limitant le retard de transmission. 

30 
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3.2 Traitement de vidange 

L'accumulation de trames est d'abord detectable au niveau de la 
memoire " FIFO 1 puis est ensuite reportee au niveau de la memoire 
5 « FIFO 2 ». 

Le procede propose gere I'information du remplissage d'une 
memoire tampon de reference, c'est v a din=h< FIFO 1 » ou " FIFO 2 " suivant 
Timplantation des taches 10, 12 et 14 (explicitees precedemment) dans le 
recepteur. En effet, si les taches 12 et 14 sont liees, I'information de 

10 remplissage qui est utilisee par ie procede est celle relative a la memoire " 
FIFO 1 " qui fait tampon entre le reseau et le systeme de rendu sonore. De 
la meme fa<?on, si les taches 10 et 12 sont liees, c'est la memoire " FIFO 2 " 
qui fait tampon et done c'est son taux de remplissage qui est pris en 
consideration pour le traitement de gestion. 

15 Le traitement va maintenant etre explicate en se plagant dans le 

deuxieme cas de figure. Le premier cas s'en deduit de fagon immediate par 
transposition. 

Afin de conserver au mieux une synchronisation entre le codeur et le 
decodeur et done une restitution sonore optimale, on choisit de decoder 

20 toutes les trames venant du reseau. Le traitement decide en fonction de 
I'information de remplissage Taction liee a la trame decodee. Cette action 
est detaillee par la suite. Pour activer le traitement, des seuils de 
remplissage sont utilises. Ces seuils definissent des niveaux d'alarme de 
remplissage de la " FIFO Pour agir de maniere la moins audible possible 

25 (e'est-a-dire pour limiter la degradation de qualite), deux niveaux d'actions 
sont choisis. Un premier niveau (niveau d'alarme 1) correspond a un niveau 
non critique de remplissage excessif (loin du remplissage maximal tolere), 
le second (niveau d'alarme 2) correspond lui a une action obligatoire sur 
chaque trame (moyennement proche du remplissage maximal tolere). Un 

30 troisieme niveau (niveau d'alarme 3), dit de securite (pour eviter des 
debordements de memoire, ou autre probleme) a ete defini. II correspond a 
un remplissage proche du maxima! tolere. Ce niveau d'alarme n'est en fait 
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jamais atteint si les actions des deux seuils precedents sont bien effectuees 
et si les seuils sont correctement definis. 

Lors de chaque decodage, rinformation de remplissage est 
comparee aux seuils pour connaitre I'etat de la " FIFO " (en alarme ou non), 
5 et le cas echeant le niveau de I'alarme. 

Si I'etat obtenu, n'est pas un etat d'alarme, aucune action est 
effectuee, et la trame decodee est stockee dans " FIFO 2 '\ 

Dans le premier etat d'alarme, on considere qu'au moins 50% du 
signal issu d'une conversation est inutile ; on supprime done, dans ce 
10 niveau d'alarme, toutes les trames ne presentant que tres peu 
d'informations. Pour cela, ce traitement peut mettre en oeuvre un DAV 
simple (DAV = Detecteur d'Activite Vocale) qui scrute toutes les trames 
d'echantillons apres leur decodage et permet de decider de leur ecriture ou 
non dans " FIFO 2 Le traitement peut aussi decider a partir d'informations 
15 directement puisees dans la trame de codes de ('importance ou non de 
rinformation qu'elle contient. Dans cet etat . d'alarme, toute trame 
consideree comme ne contenant que du bruit, ne sera pas stockee dans " 
FIFO 2 " pour une future restitution sonore. 

Dans le second etat d'alarme (niveau critique), it est necessaire 
20 d'agir sur chaque trame pour limiter tres fortement I'accroissement du 
remplissage de la memoire " FIFO 2 ". A ce niveau le traitement precedent 
(e'est a dire celui mis en ceuvre pour le niveau d'alarme 1) reste actif. Mais 
cette fois, il est impose de reduire deux trames consecutives a une trame ou 
moins. Une decision est done prise a partir de deux trames d'echantillons 
25 non " silencieuses " (en effet, si une trame est " silencieuse elle n'est tout 
simplement pas ecrite dans " FIFO 2 " (cas de I'etat d'alarme 1 inclus dans 
I'etat d'alarme 2)). L'action sur deux trames consecutives n'est done 
engagee que lorsqu'une trame est detectee comme non « silencieuse ». 
Cette trame est d'abord memorisee, ensuite si la seconde trame est M 
30 silencieuse alors e'est cette premiere trame qui est ecrite dans " FIFO 2 

Dans le cas ou ies deux trames contiennent des informations 
importantes, il convient de remplacer ces deux trames par une seule 
minimisant la perte d'information et la degradation de qualite. C'est cette 
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trame resultante qui sera stockee dans « FIFO 2 ». Toute solution efficace 
pouvant effectuer cette tache peut etre utilisee et activee dans ces 
conditions (second etat d'alarme, et deux trames non « silencieuses »). 
Deux exemples d'algorithmiques pour effectuer cette tache sont presentes 
5 ci-dessous. 

Selon une premiere solution d'algorithmique^on remplace les deux 
trames bout a bout -'par' uhfe 'sbufe^Vrarff^du chaque coefficient Xj (avec j 
allant deOa N-1 (N nombre d'echantillons par trame)) prend la valeur (xj + 
x i+ i)/2 (avec i allant de 0 a 2*N-1, les Xj provenants des deux trames 
10 originates). Cette solution revient en quelque sorte a faire du sous 
echantillonnage lisse. La frequence du signal restituee est alors double sur 
cette trame. Cependant, il a ete constate par les inventeurs que lorsque 
I'etat d'alarme 2 n'est pas tres frequent, cette solution suffit pour rnaintenir la 
qualite du rendu sonore. 
15 Selon une deuxieme solution, on met en ceuvre une detection de la 

hauteur du signal pour compacter les deux trames en une pseudo-trame de 
longueur inferieure ou egale a celle d'une trame. Le nombre d'echantillons 
contenus dans cette pseudo-trame est determine par information de 
frequence de fondamental ("pitch" selon la terminologie anglo-saxonne), 
20 mais est de toute maniere inferieure ou egale a la longueur d'une trame 
normale, tout en etant proche de cette longueur de trame. Ualgorithme 
utilise permet d*assurer une continuite du signal de rendu sans trou audible, 
ni doublement de frequence, tout en divisant le stockage du signal d'un 
facteur superieur ou egal a 2. Ceci est explicite plus en details au 
25 paragraphe 3.4 ci-apres. De plus, il minimise aussi ainsi la perte 
d'informations sonores, en supprimant en fait moins de 50 % de 
Information. 

On notera que dans le cas ou le recepteur met en oeuvre son 
traitement a partir d'une analyse de " FIFO 1 " , le decodeur etant 
30 directement relie au systeme de rendu sonore, il se doit de generer un 
nombre d'echantillons suffisants, soit dans notre cas d'assurer la mise a 
disposition d'au moins une trame d'echantillons dans " FIFO 2 
L'algorithme de concatenation de trames est alors calibre pour generer 
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toujours un minimum d'echantillons, mais au moins une trame. Une autre 
solution peut aussi consister a Tactiver plusieurs fois au lieu d'une seule fois 
quand cela est necessaire pour obtenir un nombre d'echantillons suffisant. 

Dans le troisieme niveau d'alarme, normalement jamais atteint, 
5 aucune trame n'est stockee dans « FIFO 2 ». En variante, le systeme peut 
aussi decider d'effectuer une vidange brutale d'une partie de la memoire 
tampon (ceci pourra etre (e cas;* si- c'est-la' gestion de " FIFO 1 " qui est 
activee). 

On notera egalement que suivant les reseaux et les types de 
10 problemes d'asynchronisme, on peut choisir d f activer ou non certains 
niveaux d'alarme. Par exemple dans le cas « d'asynchronisme faible », les 
niveaux d'alarme 1 et 2 peuvent etre regroupes, et la solution simple de 
remplacement de deux trames par une seule peut alors etre le seul 
traitement actif. 

15 

3. 2 Seuils d'alarme 

On va maintenant decrire de fa?on plus detaillee les seuils d'alarme 
et leur gestion. 

Comme cela a ete explique precedemment, la memoire de 
20 reference est declaree en etat d'alarme 1, lorsque son remplissage est 
superieur au seuil 1 ; cet etat reste actif jusqu'a ce que le remplissage 
devienne inferieur au seuil 0. Uetat 1 suit done un fonctionnement sous 
forme d'hystheresis. 

La memoire est declaree en etat d'alarme 2, si le remplissage 
25 devient superieur au seuil 2, et en etat d'alarme 3, si le remplissage est 
superieur au seuil 3. Une gestion de ces etats d'alarme par hystheresis peut 
aussi etre envisagee. 

Les seuils 0, 1 et 2 sont adaptatifs. Le seuil 3 qui est lui directement 
lie a la taille maximale toleree est fixe. L'adaptation de ces seuils est 
30 necessaire pour prendre en charge les differents contextes des 
communications et les fluctuations au cours du temps de celle-ci. En effet, 
il convient de pouvoir neanmoins autoriser plus de retard quand il y a 
beaucoup de gigue dans la communication (la prise de retard au rendu 
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restant le meilleur moyen d'assurer une qualite correcte en presence de 
gigue). Dans un contexte de gigue importante, il convient done d'avoir les 
seuils 0, 1 et 2 a des niveaux assez eleves. 

Pour faciliter le traitement, la position des seuils peut correspondre 
5 a un nombre entier de la taille des frames echangees entre les differentes 
taches du recepteur. Soit Tt cette taille de trames. 

Les valeurs initiates de ces seuils peuvent par exemple etre les 
suivantes : 

Seuil 0 : 5 x Tt 
10 Seuil 1 : 8 x Tt 

Seuil 2 : 12 x Tt 

Seuil 3 : 24 x Tt (valeur fixe) 

Les seuils 0, 1 et 2 pourront etre adaptes ensemble par pas de taille 
Tt. Les valeurs extremes admises peuvent par exemple etre de -1 a +8. 

15 Ainsi, par exemple, le seuil 1 peut prendre les valeurs 7x, 8x, 9x, 

10x, .... 16x Tt. L'adaptation proprement dite des seuils se fait a partir d'un 
critere d'adaptation qui est le temps passe en etat d'alarme. A cet effet, un 
pourcentage d'etat d'alarme est evalue toutes les N secondes environ (par 
exemple N = 10). Lorsque ce pourcentage est superieur a un seuil donne 

20 (5%) les seuils d'etat d'alarme sont augmentes ; lorsqu'au contraire ces 
pourcentages sont inferieurs a un seuil minimal donne (0,5%), les seuils 
d'alarme sont diminues. Pour eviter une trop grande oscillation du systeme 
due a une adaptation trop frequente des seuils, un hystheresis est applique 
sur la decision d'adaptation. En effet, les seuils ne sont reellement 

25 augmentes d'un pas qu'en presence de deux options d'augmentation 
consecutives et diminuees d'un pas en presence de trois options de 
diminution consecutives. II s'ecoule done au minimum 2*N secondes entre 
deux increments de seuils et 3*N secondes entre deux decrements de 
seuils. La procedure d'augmentation des seuils peut etre acceleree si un 

30 important pourcentage de trames est en alarme. Une procedure 
acceleratrice consiste a incrementer directement les seuils si par exemple le 
pourcentage d'alarme est superieur a 50 %. 



This Page Blank (uspto) 



WO 01/01727 



PCT/FR00/01734 



24 

Bien entendu, les valeurs seuils donnees pour les pourcentages 
d'alarme ne sont fournies qu'a titre indicatif. 

3.3 Interaction avec le premier traitement 

5 

Le premier traitement est le traitement qui declenche la generation 
" -\£ 7"? cf" ? 

de « fausses » trames sur perte de trames ou trames'erronees. Dans le cas 

ou le systeme est en alarme (surabondance de trames), il devient inutile de 

generer ces « fausses » trames qui ne vont qu'aggraver le phenomene de 

0 surabondance. Toutefois, il est important pour la qualite du rendu 
acoustique de garder une synchronisation codeur - decodeur en informant 
le decodeur de la perte de trame (en langant par exemple, une ou deux 
generations de fausses trames (mais pas plus)). Le troisieme traitement 
agira en etat d'alarme sur le premier traitement pour limiter fortement la 

5 generation de « fausses » trames. 

3.4 Concatenation de trames 

Le traitement de concatenation a pour but de raccourcir la duree 
0 d'un signal audio numerique contenant de la parole ou de la musique en 
introduisant le moins de degradation audible possible. La frequence 
d'echantillonnage etant donnee et fixee, on diminue le nombre des 
echantillons qui sont envoyes a I'appareil de restitution de son. Une solution 
evidente pour raccourcir une sequence de N echantillons est d'enlever M 
5 echantillons regulierement espaces de la sequence en question. Ceci 
entraine ('augmentation de la frequence fondamentale qui peut etre genante 
a Tecoute surtout lorsque le rapport M/N est eleve. De plus, on risque de ne 
plus respecter le theoreme d'echantillonnage. Le traitement presente ci- 
dessous permet de raccourcir une sequence audio sans modifier la 
3 frequence fondamentale et sans introduire une degradation audible due a la 
discontinuity du signal. Ce traitement est base sur une detection de la 
valeur de la periode « pitch ». Le nombre des echantillons elimines par cet 
algorithme ne peut pas etre choisi librement, il est un multiple de la valeur 
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du pitch P. On peut toutefois definir le nombre minimal des echantillons a 
eliminer N em in qui doit verifier la relation N em .n<N/2. Comme, dans le cadre du 
dispositif de gestion de I'asynchronisme d'une transmission audio, le but est 
de supprimer au moins 50% des echantillons. On fixe avantageusement 
Nemin^N^. On suppose egalement que la valeur maximale du pitch P est 
inferieure a la longueur N de la sequence a raccourcir. Le nombre N e des 
echantillons elimines par ralgorithme est alors le plus petit multiple de la 
valeur du pitch P qui est superieur ou egal a N em in : N e =kP, ou k est un 
entier positif, N e >Nemin > N e -P. La longueur du signal de sortie est alors N r =N- 
N e . notons le signal d'entree a raccourcir s(n), n=1,... f N est le signal de 
sortie s'(n), n=1,..., N r . Pour assurer la continuity du signal de sortie, on fait 
la fusion progressive des premiers et des derniers N r echantillons du signal 
s(n) : s , (n)=s(N e =n).w(n)+s(n).(1-w(n)) J n=1,... f N r 

ou w(n) est une fonction de ponderation telle que 0<w(n)<1,n=1,...,N r , et 
w(n)<w(n+1),n=1,... f N 1 -1. Par exemple, w(n) peut etre tout simplement la 
fonction lineaire w(n)=n/N r . Pour un signal non voise ou on ne peut pas 
determiner le pitch, N e peut etre fixe librement. 

La figure 4 representant des sequences A, B, C et D de signaux 
illustre la mise en oeuvre du traitement sur un exemple concret. La premiere 
sequence (A) montre le morceau de signal s(n) de N=640 echantillons a 
raccourcir en trait plein. Le but est de raccourcir cette sequence par au 
moins 320 echantillons, sans changer la frequence fondamentale, et sans 
introduire une discontinuite ou autres degradations audibles. Le pitch de 
s(n) varie lentement, sa valeur est egale a 49 au debut de la sequence et 45 
a la fin de la sequence. Le pitch detecte par une methode de correlation est 
P=47. Ainsi, s(n) sera raccourci par k=7 periodes, soit N e =kP=7*47=329 
echantillons. 

Dans cet exemple on a choisi la ponderation lineaire. Les 
sequences B et C illustrent les deux morceaux de signal de longueur N r =N- 
N e =311 deja ponderes qui seront fusionnes dans la suite. La fusion 
s'effectue en additionnant ces deux signaux. Sur la sequence C, on peut 
observer qu'a cause de la legere variation du pitch, ces deux morceaux de 
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signal s(n) sont un peu dephases. Grace a la technique de fusion utiiisee, 
ceci n'introduit pas une discontinuity dans le signal de sortie s'(n) (trait plein 
sur la sequence D). On voit egalement sur la sequence 4 que le signal 
raccourci s'(n) reste parfaitement en phase avec les signaux precedant et 
5 suivant (trait en tirets sur les figures 1 et 4). 
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R EVE N D I C ATI O N S 

1. Procede pour la gestion du decodage et de la restitution d'un 
5 signal sonore, dans un systeme de transmission asynchrone, selon lequel 
on detecte une eventuelle surabondance de remplissage de ladite memoire 
tampon et/ou d'unedieuxiem^ entree ou en sortie du 

bloc de decodage en comparant le taux de remplissage a au moins un seuil, 
caracterise en ce que, selon la valeur du taux de remplissage, 
0 - on met en oeuvre une detection d'activite vocale et on supprime 

les trames considerees comme non actives par cette detection, 

- on met en oeuvre un traitement de concatenation sur deux trames 
successives. 

2. Procede selon la revendication 1, caracterise en ce qu'on met on 
5 met en oeuvre une detection d'activite vocale et on supprime les trames 

considerees comme non actives par cette detection, lorsque le taux de 
remplissage est compris entre un premier et un deuxieme seuil et en ce 
qu'on met en oeuvre un traitement de concatenation sur deux trames 
successives, lorsque le taux de remplissage est compris entre un deuxieme 
et un troisierne seuils. 

3. Procede selon la revendication 2, caracterise en ce que le 
premier et le deuxieme seuiis sont confondus. 

4. Procede selon Tune des revendications precedentes, caracterise 
en ce qu'on detecte en entree ou en sortie d'un bloc de decodage 
comportant une premiere memoire tampon en entree et/ou en sortie une 
eventuelle trame manquante ou erronee ou une eventuelle absence 
d'echantillons a restituer et on genere une fausse trame qui assure la 
continuity du rendu audio lorsqu'une telle trame manquante ou erronee ou 
une telle absence d'echantillons a restituer est detectee. 

5. Procede selon la revendication 4, caracterise en ce que dans le 
cas ou le bloc de decodage met en oeuvre de fagon cyclique son traitement 
de decodage par rapport au contenu de la premiere memoire tampon, on 
met en oeuvre avec la meme frequence cyclique la detection d'une 
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eventuelle trame manquante ou erronee ou d'une eventuelle absence 
d'echantillons a restituer, cette detection intervenant suffisamment en 
avance par rapport au traitement de decodage de fagon a permettre une 
generation de fausse trame en temps voulu. 
5 6. Procede selon Tune des revendications 4 et 5, caracterise en ce 

qu'on ne genere pas de fausse trame lorsqu'une detection de trame 
manquante ou erronee intervient sur.une trame pour Jaquelle une absence 
d'echantillons a deja ete detectee. 

7. Procede selon Tune des revendications 4 a 6, caracterise en ce 
10 que dans le cas ou le systeme est d'un type qui peut arreter volontairement 

d'emettre des trames, on memorise d'une trame a I'autre le type de trame 
precedemment generee et on determine en fonction de cette information s'il 
faut generer des fausses trames ou des trames de silence. 

8. Procede selon Tune des revendications precedentes, caracterise 
15 en ce que dans un traitement de concatenation de deux trames successives 

on pondere les echantillons de fa<pon a donner plus d'importance aux 
premiers echantillons de la premiere trame et aux demiers echantillons de 
la deuxieme. 

9. Procede selon Tune des revendications precedentes, caracterise 
20 en ce que le (ou les) seuil(s) est (ou sont) adaptatif(s). 

10. Procede selon la revendication 9, caracterise en ce que 
I'adaptation d'un seuil est fonction du temps passe avec un taux de 
remplissage superieur a un seuil donne. 

11. Dispositif de restitution d'un signal de parole comportant une 
25 premiere memoire tampon recevant des trames codees, des moyens 

mettant en ceuvre un traitement de decodage sur les trames memorisees 
dans ladite premiere memoire tampon, une deuxieme memoire tampon 
recevant des trames decodees en sortie des moyens de decodage, des 
moyens de restitution sonore recevant les trames en sortie de la deuxieme 
30 memoire tampon, caracterise en ce qu'il comporte en outre des moyens 
pour mettre en ceuvre le procede selon Tune des revendications 
precedentes. 
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2. Ce RAPPORT comprend 5 feuilles, y compris la presente feuille de couverture. 
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I'administration chargee de I'examen preliminaire international (voir la regie 70.16 et I'instruction 607 des Instructions 
administratives du PCT). 
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I S Base du rapport 
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III □ Absence de formulation d'opinion quant a la nouveaute, I'activite inventive et la possibilite 

d'application industrielle 
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V S Declaration motivee selon I'article 35(2) quant a la nouveaute, I'activite inventive et la possibilite 
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I. Base du rapport 

1 . En ce qui concerne les elements de la demande internationale (fes feuilies de remplacement qui ont ete remises 
a I'office recepteuren reponse a une invitation faite conformement a i'articie 14 sont considerees dans le present 
rapport comme "initiaiement deposees" et ne sont pas jointes en annexe au rapport puisqu'eiies ne contiennent 
pas de modifications (regies 70. 16 et 70.17)): 

Description, pages: 

1-8,10-26 version initiate 

9,9bis regue(s) le 23/07/2001 avec la lettre du 20/07/2001 

Revendications, N°: 

1 -1 1 regue(s) le 23/07/2001 avec la lettre du 20/07/2001 

Dessins, feuilies: 

1/2,2/2 version initiale 



2. En ce qui concerne la langue, tous les elements indiques ci-dessus etaient a la disposition de ['administration ou 
lui ont ete remis dans la langue dans laquelle la demande internationale a ete deposee, sauf indication contraire 
donnee sous ce point. 

Ces elements etaient a la disposition de ('administration ou lui ont ete remis dans la langue suivante: , qui est : 

□ la langue d'une traduction remise aux fins de la recherche internationale (selon la regie 23.1(b)). 

□ la langue de publication de la demande internationale (selon la regie 48.3(b)). 

□ la langue de la traduction remise aux fins de I'examen preliminaire internationale (selon la regie 55.2 ou 
55.3). 

3. En ce qui concerne les sequences de nucleotides ou d'acide amines divulguees dans la demande 
internationale (le cas echeant), I'examen preliminaire internationale a ete effectue sur la base du listage des 
sequences : 

□ contenu dans la demande internationale, sous forme ecrite. 

□ depose avec la demande internationale, sous forme dechiffrable par ordinateur. 

□ remis ulterieurement a I'administration, sous forme ecrite. 

□ remis ulterieurement a I'administration, sous forme dechiffrable par ordinateur. 

□ La declaration, selon laquelle le listage des sequences par ecrit et fourni ulterieurement ne va pas au-dela 
de la divulgation faite dans la demande telle que deposee, a ete fournie. 

□ La declaration, selon laquelle les informations enregistrees sous dechiffrable par ordinateur sont identiques a 
celles du listages des sequences Presente par ecrit, a ete fournie. 



Formulaire PCT/IPEA/409 (cadres l-VIII, feuille 1) (juillet 1998) 



This Page Blank (uspto) 



RAPPORT D'EXAMEN 
PRELIMINAIRE INTERNATIONAL 



Demande internationale n° PCT/FR00/01 734 



4. Les modifications ont entralne I'annulation : 

□ de la description, pages : 

□ des revendications, n os : 

□ des dessins, feuitles : 



5. □ Le present rapport a ete formule abstraction faite (de certaines) des modifications, qui ont ete considerees 

comme allant au-dela de I'expose de I'invention tel qu'il a 6te depose, comme il est indique ci-apres (regie 
70.2(c)): 

(Toute feuille de remplacement comportant des modifications de cette nature doit etre indiquee au point 1 et 
annexee au present rapporff 

6. Observations complementaires, le cas echeant : 



V. Declaration motivee selon Particle 35(2) quant a la nouveaute, Tactivite inventive et la possibility 
d application industrielle; citations et explications a I'appui de cette declaration 

1. Declaration 

Nouveaute Oui : Revendications 1-11 

Non : Revendications 

Activite inventive Oui : Revendications 1-1 1 

Non : Revendications 

Possibility d'application industrielle Oui : Revendications 1-11 

Non : Revendications 



2. Citations et explications 
voir feuille separee 



VIII. Observations relatives a la demande internationale 

Les observations suivantes sont faites au sujet de la clarte des revendications, de la description et des dessins 
et de la question de savoir si les revendications se fondent entierement sur la description : 
voir feuille separee 
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Concernant le point V 

Declaration motivee selon I'article 35(2) quant a la nouveaute, I'activite inventive et 
la possibility d'application industrielle; citations et explications a I'appui de cette 
declaration 

1 . II est fait reference aux documents suivants: 

D1 : WO 99 1 7584 A (3COM CORP) 8 avril 1 999 (1 999-04-08) 

D2: US-A-4 703 477 (ADELMANN HARRY W ET AL) 27 octobre 1987 (1987-10-27) 

2. Le document D1 (voir en particulier page 4, ligne 3 - page 6, ligne 1 1 ; page 22, ligne 
16 - page 28, ligne 31; Fig.2, 8), qui est considere comme etant I'etat de la technique 
le plus proche de I'objet de la revendication 1 , decrit un procede pour la gestion du 
decodage et de la restitution d'un signal sonore, dans un systeme ATM, selon lequel 
on detecte une surabondance de remplissage d'une memoire tampon. 

2.1 D1 differe de I'objet de la revendication 1 en ce qu' on met en oeuvre un traitement 
de concatenation sur deux frames successives lors de la detection de la surabon- 
dance de remplissage de la memoire tampon. 

2.2 Cette caracteristique effectue le compactage des deux trames en une pseudo-trame 
de longueur inferieure ou egale a celle d'une trame. 

Le probleme que la presente invention se propose de resoudre peut done etre 
considere comme minimiser la perte d'information et la degradation de qualite lors 
de la detection de la surabondance de remplissage d'une memoire tampon. 

2.3 Le document D2 ne mentionne pas le compactage des deux trames en une pseudo- 
trame de longueur inferieure ou egale a celle d'une trame. 

2.4 Aucun des documents cites, considere.. seuL ou en combinaison,. ne revele Ja 
reduction de la taille d'une trame formee de deux trames en cas de surabondance 
de remplissage de memoire. Par consequent, la revendication 1 remplit les 
conditions de nouveaute et I'activite inventive selon Article 33(1 )-(4) PCT. 

2.5 Les revendications 2-10 dependent de la revendication 1 et satisfont done egale- 
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ment, en tant que telles, aux conditions requises par le PCT en ce qui concerne la 
nouveaute et I'activite inventive. 

3. Le meme argument s'applique a la revendication 11 qui represente la meme 
combinaison de caracteristiques comme revendication 1, mais qui est formulee 
comme un dispositif (voir aussi le point VIII ci-dessous). 

Par consequent, I'objet de la revendication 11 aussi remplit les conditions de 
nouveaute et I'activite inventive selon Article 33(1 )-(4) PCT. 



Concernant le point VIII 

Observations relatives a la demande internationale 

1 . Comment deja constate dans la Premiere Opinion Ecrite, quant a la revendication 1 1 , 
bien qu'elle fasse reference a d'autres revendications, elle est a considerer comme 
une revendication independante, car elle est d'une categorie differente (dispositif). 
La revendication 1 1 devrait done inclure les caracteristiques essentielles a la 
definition du dispositif revendique, de maniere a clairement definir les moyens pour 
mettre en oeuvre le procede selon Tune des revendications 1-10. 

La revendication independante 1 1 ne contenant pas ces caracteristiques, ne remplit 
pas la condition visee a PArticle 6 PCT en combinaison avec la Regie 6(3)(b) PCT, 
qui prevoient qu'une revendication independante doit contenir toutes les caracteris- 
tiques techniques essentielles a la definition de I'invention. 

2. La revendication 1 n'est pas claire et ne satisfait pas aux conditions requises a 
I'Article 6 PCT, dans la mesure ou I'objet pour lequel une protection est demandee 
n'est pas clairement defini. Ainsi, la formulation vague et imprecise utilisee dans 
I'expression "situee(s) en entree ou en sortie du bloc de decodage" (page 27, lignes 
5-6) ne permet pas a I'homme du metier de determiner quelles sont les caracteris- 
tiques techniques necessaires a la realisation de I'equipement revendique, parce que 
selon la description il est clair qu'il y a toujours deux memoires tampon, une en 
entree et une en sortie du bloc de decodage. Ainsi, cette expression aurait ete 
formulee comme "situee(s) en entree et en sortie". 
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